頻道 > 生活 >   >  正文

        天天熱資訊!大模型扎堆「趕考」,語文還是國產AI行,文言文能力超過95%考生

        評論

        魚羊 蕭簫 發自 凹非寺


        (資料圖)

        量子位 | 公眾號 QbitAI

        ChatGPT誕生后的第一場全國高考,考生忙,大模型們也很忙。

        這不,高考還沒結束,AI挑戰高考題就成了刷屏熱搜話題,各家大模型都被拉出來寫起了高考作文,甚至是參與整場考試。

        (不知是不是巧合,Bard還在下午數學高考后,緊急升級了一波數學推理能力……)

        結果,竟然有大模型寫的作文,把資深高中老師都騙過了!

        就在考試當天,百度搜索正在內測的“AI伙伴”,現場直播挑戰了一套語文試題。

        從“基礎題”文言文翻譯、閱讀填空、古詩詞賞析,到“拉分題”微寫作和作文,AI伙伴全部上手做了一遍。

        結果,當9份“混進”了AI伙伴作品的高考作文送到語文老師莊臨旭手上時,他完全沒發現有篇是AI寫的:

        我是真沒想到,AI還能寫文言文作文。

        緊接著,AI伙伴展現的文言文理解能力,更是把資深老師嚇了一跳:

        憑借我的教學經驗來看,超過95%的同學沒問題。

        一整場直播下來,就連圍觀了AI伙伴考試全程的畢導都感慨:

        再來一次高考語文,我可能考不過它……

        所以,集成了百度語義檢索技術+大模型能力于一身的AI伙伴,整場考試表現具體如何?

        咱們一項一項展開來看。

        “AI考生”現場挑戰語文高考

        先來看看大模型的“基礎題”——古詩詞賞析。

        面對情感和寫法的“找不同”問題,百度搜索AI伙伴胸有成竹,不僅給出了明確的修辭手法,還進一步分析了古詩的來歷和情感,屬實是閱讀理解十分到位了:

        再到閱讀填空。面對文章解讀和“續寫句子”能力,AI伙伴同樣毫不遜色:

        那么,來看看大模型的“拉分題”寫微作文,依舊沒什么問題!

        要是小作文體現不出來,再來看看AI伙伴作詩的能力。不僅現代詩手到擒來,甚至連藏頭詩都能搞定:

        不過,要是再仔細一點搞搞提示詞工程,AI伙伴似乎就答得更好了。

        以高考語文題目中的古詩詞理解為例,這里我們先在不給提示詞的情況下,把題目原樣“喂”給AI伙伴:

        AI伙伴給出來的答案雖然也不錯,但對于高考題目來說,這答案著實有億點長,也有點太仔細了:

        接下來,給AI伙伴換上強調“最重要的三個意象”的提示詞。

        果然,AI給出了更精準的回答,指出包括病柏、丹鳳和鴟鸮在內的三個意象,是最關鍵的:

        但是,上述都還只是直播中展現出來的效果。像AI伙伴這類有大模型加持的功能,其使用效果是否真的和提示詞工程強相關?

        為了測測AI伙伴的“真正實力”,我們親自上手測了測它做高考題的效果。

        直播中已經做過了全國甲卷的作文題目,那么我們再來試試今年上海卷的作文。

        第一輪,我們直接把題目甩過去:

        看起來,AI伙伴雖然理解了文章“主旨”,但寫出來還差點意思:論點不夠明確,作文的結構也不太清晰。

        第二輪,我們試著換了一下提示詞,給AI伙伴設置一個“角色扮演”效果。

        首先,強調它是一名高考考生,然后給它“灌輸”一些高考作文的寫作技巧:

        這一輪,AI伙伴寫得就有高考作文內味了。

        不僅給出了10字以內的標題,還按照總分總、夾敘夾議的方式,很好地寫出了一篇議論文:

        看起來,挖掘大模型的潛力,很大程度上確實要依靠提示詞工程。

        在直播中,百度集團副總裁、搜索平臺負責人肖陽還給我們列舉了一個非常簡潔的提示詞公式:

        提示詞 = 任務 + 角色 + 上下文背景 + 細節補充。

        有了它,不用再擔心大模型輸出和設想無關的答案了。

        當然,作為百度“用大模型重塑搜索能力”的終極殺器,AI伙伴能實現的功能,也遠不止是做做高考題而已。

        最早在2023萬象·百度移動生態大會上官宣發布的AI伙伴,目前已經開啟內測,獲得試用資格后,可以直接從百度搜索界面進入:

        它的本職工作,更像是一個搜索引擎端的全能AI助理,不僅具有智能搜索能力,還兼具創作生成技藝:

        一方面,AI伙伴相當于一個對話版智能搜索工具。用它查資料,不需要再按關鍵詞搜索,直接“用人話”提問就行:

        不僅如此,每一句回答都有理有據,如果想要“追根溯源”,直接點鏈接就能跳轉到對應的網站:

        這樣一來,就不用擔心它會出現像ChatGPT整理文件那樣,出現“無中生有”一些案件的操作了。

        另一方面,它又相當于一個多模態大模型創作助手

        不僅可以幫助查資料、寫周報、畫頭像,還能陪你模擬面試、甚至替你約會(?)。

        這里我們借助AI伙伴的“程序猿小助手”,來試試生成一段代碼的能力。

        以面試可能會考到的冒泡排序算法為例。

        很快啊,幾乎沒有怎么思考,AI伙伴就給出了一段帶注釋的冒泡排序算法,最關鍵的是,它自己已經運行過,并成功輸出了一段結果!

        這意味著我們不需要再自己去跑一遍這段代碼,而是能直接將它交給面試官了(doge)

        從上面這些展現的能力來看,AI伙伴所能做到的,遠非僅僅提供高考試題“參考答案”而已。

        這次選擇用它挑戰高考題,大家伙可能看的是個新鮮勁兒,但“術”的表象之外,更值得關注的是“道”的變化:

        使得AI伙伴能在高考題面前依舊“神采飛揚”的大模型技術,正在以搜索引擎的代際變革為基點,席卷各行各業,甚至改變每個人的工作方式。

        正如ChatGPT攪動風云之初,微軟CEO納德拉預測的那般:搜索正面臨巨變。

        并且變化的不僅僅是搜索的技術、產品本身,這一次,更與每一個個體有了更緊密的關聯。

        搜索三變

        百度CEO李彥宏同樣認為,“大模型即將改變世界”?;谶@樣的判斷,李彥宏2023年一季度OKR,便指向了“引領搜索體驗的代際變革”。

        現在,三個月過去,大模型究竟如何變革搜索,現在答案已經越來越清晰。

        從技術的角度出發,大語言模型的爆發,正在重新定義人機交互。

        對于人類而言,最自然的交流方式就是語言溝通。而大模型的代際突破,最直觀的一點體現,就是機器自然語言聆聽表達能力的飛速提升。

        回答來自百度搜索AI伙伴

        搜索本身,就是一種人機交互的核心方式。其本質的技術追求,就是要讓機器更高效地理解、推理、表達,化復雜問題為直觀的第一條搜索結果。

        因此可以說,大語言模型的突破,正在全面激發搜索全新的潛能。

        值得關注的一點是,伴隨著AI的發展,搜索始終都是最前沿AI技術最先落地的場景。

        以百度搜索為例,圍繞“降低用戶表達需求門檻”、“降低用戶獲取內容和服務的門檻”、“豐富搜索引擎的內容供給”這三個目標,百度搜索一直在AI技術上大量投入。

        引入大模型之前,百度搜索已經實現:

        千億級全網索引;

        全球領先的深度語義理解技術,相關成果曾獲2020年國家技術發明獎二等獎;

        最大中文知識圖譜,覆蓋50億實體。

        從產品的角度看,過去三個月,數據已經證明,對話式搜索正在成為搜索引擎市場的一個新變量。

        百度集團副總裁、搜索平臺負責人肖陽就透露,大模型加持下的AI伙伴,在內測階段就已爆火,相關搜索問答量激增。

        這進一步佐證大模型帶來的新人機交互方式,更能滿足人們對搜索“快速”、“有效”的訴求。

        牽一發而動全身,在現在這個時間節點,圍繞搜索的內容生產和創作領域,創新模式也開始逐漸顯現,并被積極地探索實踐。

        同樣是在萬象大會上,百度搜索還配合AI伙伴,推出了AI BOT解決方案。目的就是向內容、服務生產者釋放大語言模型和AI技術能力,降低其與新搜索模式融合的門檻。

        具體來說,百度搜索提供了創作者、商家、機構、服務和品牌等各類型的AI BOT,讓他們能夠利用自身優勢和獨特的內容、知識、服務,創造虛擬分身,直接回答用戶的問題。

        在技術和產品之外,更與每個人息息相關的,是用戶搜索方式的改變

        正如前文所展示的,大模型時代,“提問題”的能力正在變得越來越關鍵。

        體現在現階段,就是提示詞寫得好不好,會直接影響搜索生成結果的質量。是否掌握提示詞工程能力,就像互聯網時代開啟時,是否掌握搜索能力一樣關鍵。

        對此,肖陽提到了“搜商”的概念:

        未來不僅要卷智商、情商,還要卷“搜商”。

        更好地使用提示詞,更好地使用AI伙伴,獲得的優勢會越來越大。

        也就是說,找到合適提示詞的能力越強,越能在大模型落地應用的時代里,充分利用大模型的強大生產力。

        可以說,大模型刮起的時代風暴之下,搜索三變,既是內在技術瓶頸的代際突破,亦是外在人類接觸信息方式的徹底變革。

        無怪乎肖陽作為技術變革的一線親歷者,會有這樣的判斷:

        語義檢索技術與大語言模型結合,促進搜索的理解、推理、組織和創作潛能進一步釋放,有望在多方面催生顛覆式創新,促成搜索奇點降臨。

        并且這一次,或許每一個人都會真真切切感受到這種代際變革帶來的影響。

        One More Thing

        說起來,就在高考這兩天,AI加持下的百度搜索,忙的還不止有刷題這件事兒。

        每年此時,百度都會啟動專門的高考服務,通過搜索和AI核心技術,為考生和家長提供便利。

        今年,百度還基于AI技術,首次推出了高考搜索指數,涵蓋專業搜索熱度及變化趨勢、“院校PK”等信息??忌议L在擇校選專業的時候,可以更方面地參考對比。

        AI志愿助手也進行了重大升級,能更直觀地展示志愿預測結果,提供相關數據來輔助考生家長做決策。

        對了,利用高考搜索指數和其他高考相關搜索數據,百度還聯合中國教育在線掌上高考發布了不少有意思的數據:

        高校方面,搜索熱度最高的本科院校里,南方高校霸榜雙一流和非雙一流大學前十。

        ??圃盒V校綎|是搜索職業教育最多的省份。

        專業方面,醫學搜索熱度斷層第一,航空航天熱度攀升最快。

        而最有“錢”景的,是船舶電子電氣工程……

        標簽:

        今日熱點

        熱點排行

        最近更新

        所刊載信息部分轉載自互聯網,并不代表本網贊同其觀點和對其真實性負責。郵箱:5855973@qq.com

        聯系我們| 中國品牌網 | 滬ICP備2022005074號-18 營業執照  Copyright © 2018@. All Rights Reserved.

        亚洲成在人线电影天堂色| 国产亚洲欧美日韩亚洲中文色| 亚洲熟女综合色一区二区三区 | 亚洲色大成网站www久久九| 亚洲午夜精品一区二区公牛电影院| 久久亚洲精品成人AV| 亚洲国产第一页www| 亚洲精品高清视频| 亚洲午夜在线电影| 亚洲美女大bbbbbbbbb| 亚洲综合小说久久另类区 | 亚洲av成人一区二区三区在线观看| 亚洲国产精品18久久久久久| 亚洲国产一区二区三区在线观看| 亚洲 暴爽 AV人人爽日日碰| 亚洲娇小性xxxx| 亚洲熟妇丰满xxxxx| 亚洲欧美日韩一区二区三区在线| 亚洲日本在线电影| 亚洲AV日韩AV一区二区三曲| 亚洲a无码综合a国产av中文| 国产亚洲男人的天堂在线观看| 婷婷亚洲天堂影院| 久久亚洲中文字幕精品一区四| 中文字幕精品亚洲无线码二区 | 精品亚洲AV无码一区二区三区 | 亚洲第一区二区快射影院| 亚洲欧美国产国产一区二区三区| 亚洲AV无码专区在线观看成人 | 亚洲国产国产综合一区首页| 91天堂素人精品系列全集亚洲| 亚洲特级aaaaaa毛片| 波多野结衣亚洲一级| 亚洲色无码专区一区| 天天综合亚洲色在线精品| 亚洲免费在线观看| 国产亚洲成av人片在线观看| 亚洲好看的理论片电影| 亚洲成人高清在线观看| 国产亚洲精品VA片在线播放| 色偷偷亚洲第一综合|