全網(wǎng)沸騰!AI大模型「開源之王」Llama 3正式發(fā)布:性能比肩GPT-4
千呼萬喚!全球AI大模型開發(fā)者翹首以盼的——Llama 3,來啦!
北京時(shí)間今天凌晨,硅谷AI大廠Meta官網(wǎng)上新,官宣Llama 3正式發(fā)布。
這波發(fā)布,提供80億和700億參數(shù)兩個(gè)版本。
有意思的是,80億版本在某些測評項(xiàng)目的成績上還超過了70億版本。
Meta同時(shí)宣布,Llama 3繼續(xù)走開源大模型路線,人人可耍。
官方數(shù)據(jù)顯示,Llama 3 8B和70B版本在同量級(jí)的較量當(dāng)中,均超越了一眾對手。
可以這么總結(jié):Meta Llama 3重新奪回開源大模型之王的寶座!
80億參數(shù)版本在MMLU、GPQA、HumanEval等多項(xiàng)基準(zhǔn)上均勝過谷歌的Gamma 7B和歐洲公司開發(fā)的Mistral 7B Instruct。
而700億參數(shù)版本甚至超越了今年初紅極一時(shí)的Claude 3 Sonnet,也與谷歌費(fèi)盡九牛二虎才整出來的Gemini Pro 1.5打得有來有回。
Meta很快就將新模式上線到Hugging Face開源社區(qū)提供試玩。
眼尖的網(wǎng)友還發(fā)現(xiàn)了更多驚喜!Meta留了一手,4000億參數(shù)的Llama 3 400B+版本,據(jù)稱能夠媲美Claude 3 Opus「超大杯」!
開源大模型,已經(jīng)完全能夠企及閉源大模型,就在2024年上半年。
一位AI寫作工具的CEO不禁感慨:我們正在步入一個(gè)新世界,一個(gè)「GPT-4量級(jí)」的開源模型可以自由訪問的世界。
英偉達(dá)科學(xué)家Jim Fan則認(rèn)為,還未開源的Llama 3 400B+將成為開源大模型的新標(biāo)桿,并且改變很多學(xué)界研究和AI初創(chuàng)公司的發(fā)展方向。
用現(xiàn)在流行的話說,那就是:開源Llama 3,源神”啟動(dòng)!
Llama 3將加速開源模型世界快速建立自己的護(hù)城河,類似于今天手機(jī)上的安卓系統(tǒng)應(yīng)用生態(tài)。
據(jù)了解,在模型訓(xùn)練方面,Meta一口氣用上2.4萬塊英偉達(dá)H100 GPU組成的算力集群。
Llama 3的的訓(xùn)練數(shù)據(jù)集多達(dá)15T Tokens,宣稱都是來自開源世界,其中95%為英文素材,其他5%涵蓋了30多種語言,也包括中文。
Llama 3訓(xùn)練的數(shù)據(jù)量比Llama 2多了7倍。
對于新發(fā)布的模型,Meta CEO扎克伯格表示:“我們的目標(biāo)不僅僅是與開源模型競爭,而是要超過所有人,打造最領(lǐng)先的人工智能。”
xAI公司的CEO馬斯克評價(jià):Not bad。——但我更關(guān)心,你倆還決斗嗎?
因此,無論是8B版本還是70B版本,Llama 3的性能都遠(yuǎn)超Llama 2.
在語言(MMLU)、百科(GPQA)、編程(HumanEval)、數(shù)學(xué)(GSM-8K、MATH)等能力上,Llama 3無一例外全面戰(zhàn)勝競爭對手。
除了常規(guī)的測試課題,Meta還評估了Llama 3在現(xiàn)實(shí)世界理解的性能,并為此獨(dú)立研發(fā)了一套高質(zhì)量的測試集。
這份測試集是另外一撥人整理的,包含1800條測試數(shù)據(jù),涵蓋編程、推理、寫作、文本總結(jié)等12種實(shí)踐用例,并對大模型的開發(fā)團(tuán)隊(duì)完全保密。
測試結(jié)果顯示,Llama 3不僅完爆Llama 2.也戰(zhàn)勝了Claude 3 Sonnet、Mistral Medium和GPT-3.5等業(yè)內(nèi)聞名的模型。
但美中不足的是,Llama 3的上下文窗口吞吐只有區(qū)區(qū)的8K,這與今年流行的「長文本」大模型標(biāo)桿來說,還停在了去年的水平。
不過也不用為此擔(dān)憂,在開源社區(qū)的開發(fā)者共同努力下,相信上下文的文本量很快就會(huì)漲上去。
作為一款開源大模型,在過去,Llama一直是沒有我們熟悉的AI在線聊天對話機(jī)器人。
目前,Llama 3的兩種參數(shù)版本均已在Hugging Face上線,在線可玩。
此外,Llama 3也會(huì)登錄微軟Azure、谷歌云、亞馬遜AWS、英偉達(dá)NIM等云服務(wù)平臺(tái)。
AI芯片廠們——英特爾、英偉達(dá)、AMD、高通等都第一時(shí)間宣布支持Llama 3在本地運(yùn)行。
但這還不夠,Meta終于以「Meta AI」的名字,推出了基于Llama 3的官方網(wǎng)頁聊天工具。
目前該平臺(tái)提供AI對話和AI繪畫兩大功能,且無需登錄。
不過,目前這套AI系統(tǒng)對中文的支持依然很差,也不支持在線文檔解讀與總結(jié)。
據(jù)我們實(shí)測后發(fā)現(xiàn),Meta方面甚至設(shè)置了漢化翻譯的安全護(hù)欄,不愿向用戶提供服務(wù)。
代碼方面,該平臺(tái)能運(yùn)行一些簡單的Python程序,但無法實(shí)現(xiàn)程序繪圖。
總的來看,「Meta AI」的網(wǎng)頁版本功能性上還比較初級(jí),有待后續(xù)更新。
想測試新模型的性能的家人們,可以復(fù)制下方的地址體驗(yàn):
??需要注意的是,目前「Meta AI」僅在美國、澳大利亞、加拿大、新西蘭、新加坡等14個(gè)國家推出。因此請選對魔法降落的地點(diǎn)。
近期文章
更多