頻道 > 生活 >   >  正文

        世界速遞!五大模型解高考數學:阿里通義千問、360智腦10題全錯得0分;訊飛星火答對一半

        評論

        一年一度高考季,高考試題是大眾關注的焦點,也成為了AI能力的試金石。AI大模型數學功底到底如何?比人類“聰明”嗎?搜狐科技使用五款AI大模型對2023高考上海數學試卷進行了同題測試。


        (相關資料圖)

        在測試中,搜狐科技選取了高考試卷前10道填空題,讓百度文心一言、阿里通義千問、科大訊飛星火認知大模型、360智腦、ChatGPT進行回答。

        測試結果顯示,這五款大模型在答數學題的能力上差異顯著。

        最“聰明”的訊飛星火答對了5題,正確率50%。百度文心一言和ChatGPT“緊跟其后”,答對了4題,正確率為40%。

        360智腦和通義千問則“全軍覆沒”,一道題也沒答對,交了白卷。

        值得一提的是,昨天搜狐科技也用五款大語言模型產品,對高考作文全國卷(甲)進行了測試,并邀請了5位語文名師打分。

        打分結果顯示,ChatGPT高考作文得分最高,文心一言、訊飛星火得分稍低,但跟ChatGPT處于同一水平。360智腦和通義千問得分最低。

        雖然語文作文題和數學計算題,對大模型能力考察的維度并不盡相同。但巧合的是,不擅長寫作文的360智腦和通義千問,似乎也不擅長做數學題。

        通過這兩次高考題測試,也能從側面反應出各家大模型的能力確實是“參差不齊”。如果ChatGPT、文心一言、訊飛星火是“學霸”,那么360智腦和通義千問則是妥妥的“學渣”。

        附測試中使用的高考數學題題目:

        1.不等式|x-2|<1的解集為__

        2.a=(2,3),b=(-1,2),則a·b=__

        3.首項為3,公比為2的等比數列的前六項和S6=__

        4.tanA=3,tan2A=__

        5.f(x)={2^xx>0;1,x≤0}的值域為__

        6.復數z=1-i,則|1+iz|=__

        7.圓的方程x^2+y^2-4y-m=0的面積為π,則m=__

        8.三角形的三邊長為a=4,b=5,c=6,則sinA=__

        9.某地一年四個季度的GDP(億元),第一季度GDP為232,第四季度GDP為241,且四個季度的GDP逐季度增長,中位數、平均數相等。則該地一年的GDP為__

        10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0,正數k的最大值為__

        責任編輯:

        標簽:

        今日熱點

        熱點排行

        最近更新

        所刊載信息部分轉載自互聯網,并不代表本網贊同其觀點和對其真實性負責。郵箱:5855973@qq.com

        聯系我們| 中國品牌網 | 滬ICP備2022005074號-18 營業執照  Copyright © 2018@. All Rights Reserved.

        日韩亚洲一区二区三区| 国产亚洲成av片在线观看| 91天堂素人精品系列全集亚洲| a级亚洲片精品久久久久久久| 亚洲成人高清在线| 亚洲А∨精品天堂在线| 亚洲国产成人久久综合碰| 亚洲AV中文无码乱人伦| 亚洲国产成人久久精品99| 亚洲欧洲中文日韩av乱码| 亚洲综合国产精品第一页| 国产日产亚洲系列| 亚洲精品狼友在线播放| 久久精品国产亚洲夜色AV网站| 亚洲av午夜福利精品一区| 亚洲韩国—中文字幕| 亚洲蜜芽在线精品一区| 亚洲综合小说久久另类区| 亚洲在成人网在线看| 亚洲H在线播放在线观看H| 国产亚洲精品影视在线| 亚洲啪AV永久无码精品放毛片| 亚洲av无码专区在线电影| 亚洲av午夜精品一区二区三区 | 伊人久久亚洲综合影院| 亚洲国产精品视频| 亚洲乱码无码永久不卡在线| 久久精品亚洲视频| 亚洲精品永久www忘忧草| 亚洲国产模特在线播放| 亚洲熟妇无码一区二区三区| 老牛精品亚洲成av人片| 中文字幕亚洲不卡在线亚瑟| 亚洲精品中文字幕无码蜜桃| 亚洲天堂在线播放| 亚洲成a人片在线看| 国产精品亚洲专区无码不卡| 久久久久亚洲AV综合波多野结衣| 国产亚洲精品一品区99热| 亚洲视频免费观看| 亚洲人成网站色7799|