北京時間5月11日凌晨,谷歌在2023年I/O開發(fā)者大會上發(fā)布了全新一代的大語言模型PaLM2,稱其可在移動設(shè)備上使用,成為了備受關(guān)注的焦點。
谷歌用了大量數(shù)學(xué)和科學(xué)數(shù)據(jù)集對PaLM2進(jìn)行訓(xùn)練,相比2022年的PaLM模型,PaLM2在多語言處理、推理和編碼能力上有了很大的提升。
(資料圖)
據(jù)官方測試,PaLM2在某些結(jié)果處理(例如數(shù)學(xué)問題)上表現(xiàn)比GPT-4更優(yōu)秀。谷歌對PaLM2做了算法優(yōu)化,使得它在體積上比PaLM要小但整體性能更好,計算效率更高。
PaLM2支持100多種不同的語言和20多種編程語言,包括JavaScript、Python、Prolog、Verilog、Fortran等。
同時,支持多模態(tài)的PaLM2還可以看懂和生成音視頻內(nèi)容,其中音視頻內(nèi)容包括曲調(diào)、編碼器、mimes、字幕、媒體類型和剪輯。
PaLM 2進(jìn)行了更多多語言能力方面的訓(xùn)練,文本橫跨100多種語言,極大程度上提高了PaLM2理解、生成和翻譯細(xì)微差異化文本的能力,解決了對成語、詩歌和謎語等具有高難度文本處理門檻的問題。與此同時,PaLM2能夠通過高級別的語言能力考試。
在推理能力方面, 由于PaLM 2在包含科學(xué)論文和數(shù)學(xué)表達(dá)式的網(wǎng)頁上進(jìn)行了訓(xùn)練并進(jìn)行模擬推理,因此具備了在邏輯、常識推理和數(shù)學(xué)方面的改進(jìn)能力。
而在編碼能力上,PaLM 2支持20多種編程語言。由于它是基于大量公開可用的源代碼數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,因此擅長處理Python和JavaScript等流行編程語言,同時也可進(jìn)行Prolog、Fortran和Verilog等小眾語言的編程。
據(jù)CEO皮查伊介紹,PaLM 2將擁有從小到大四種尺寸,分別為Gecko、Otter、Bison和Unicorn。Gecko是PaLM 2中體積最小的模型,可以在移動設(shè)備上運行,速度足夠快,即使離線狀態(tài)也可以進(jìn)行交互應(yīng)用。
Otter是中等大小模型,適合各種任務(wù),包括自然語言處理、機器翻譯和代碼生成。
Bison是更大的模型,可以處理更復(fù)雜任務(wù),例如生成逼真的圖像和視頻。
Unicorn是最大尺寸,可用于處理最復(fù)雜的任務(wù),比如編寫創(chuàng)意文本,如詩歌、代碼、腳本、音樂作品、電子郵件、信件等。
此次發(fā)布會,谷歌在多項產(chǎn)品和服務(wù)方面推出了重磅更新,涉及谷歌地圖、人工智能、搜索、安卓、谷歌云和Pixel等領(lǐng)域。
谷歌CEO皮查伊表示,此次發(fā)布的PaLM 2是目前最先進(jìn)的語言模型,也是其PaLM語言模型的第二個版本。新版本具有升級的多語言、推理和編碼能力,將為25種谷歌產(chǎn)品提供支持,進(jìn)一步擴展谷歌的AI生態(tài)圈。
前瞻經(jīng)濟學(xué)人APP資訊
更多本行業(yè)研究分析詳見前瞻產(chǎn)業(yè)研究院《2023-2028年中國AIGC產(chǎn)業(yè)發(fā)展前景預(yù)測與投資戰(zhàn)略規(guī)劃分析報告》同時前瞻產(chǎn)業(yè)研究院還提供產(chǎn)業(yè)大數(shù)據(jù)、產(chǎn)業(yè)研究、政策研究、產(chǎn)業(yè)鏈咨詢、產(chǎn)業(yè)圖譜、產(chǎn)業(yè)規(guī)劃、園區(qū)規(guī)劃、產(chǎn)業(yè)招商指南、IPO募投可研、IPO業(yè)務(wù)與技術(shù)撰寫、IPO工作底稿咨詢等解決方案。
標(biāo)簽: