最近2019年好看中文字幕视频,夜夜嗨av一区二区三区,一本久久a精品一区二区

亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁(yè) > 資訊 > 文章

2024-05-31 15:55

首個(gè)「中文大模型競(jìng)技場(chǎng)」Compass Arena上線(xiàn)，叫得上名字的國(guó)產(chǎn)大模型全員大PK

AI奇點(diǎn)網(wǎng)5月31日?qǐng)?bào)道丨熟悉大模型的朋友都曾經(jīng)聽(tīng)過(guò)這么一個(gè)網(wǎng)站——LMSYS Org推出的大模型競(jìng)技場(chǎng)Chatbot Arena，該網(wǎng)站目前已發(fā)展為海外最具公信力的大模型榜單之一，但遺憾的是，該競(jìng)賽榜單的中文水平含金量程度相對(duì)不足。

近日，上海人工智能實(shí)驗(yàn)室聯(lián)合阿里魔搭社區(qū)（ModelScope）推出中國(guó)大語(yǔ)言模型評(píng)測(cè)競(jìng)技場(chǎng)Compass Arena，首度集齊國(guó)內(nèi)開(kāi)源大模型屆豪強(qiáng)。

Compass Arena首度集齊國(guó)內(nèi)主流大模型全陣容，阿里通義千問(wèn)、百度文心一言、騰訊混元、訊飛星火、字節(jié)跳動(dòng)豆包、智譜AI、百川智能、零一萬(wàn)物、月之暗面、Minimax、深度求索、書(shū)生·浦語(yǔ)等等，共計(jì)20多款國(guó)產(chǎn)大模型出戰(zhàn)，角逐中國(guó)大模型“最強(qiáng)王者”。

據(jù)介紹，相比考題固定的傳統(tǒng)測(cè)評(píng)，由上海人工智能實(shí)驗(yàn)室打造的Compass Arena大模型競(jìng)技場(chǎng)采用盲測(cè)、開(kāi)放的測(cè)評(píng)模式，可以更全面地檢驗(yàn)?zāi)Ｐ蛯?shí)力。

Compass Arena設(shè)置了隨機(jī)、匿名對(duì)戰(zhàn)，大模型選手們成為“蒙面唱將”，模型信息隱去后，由系統(tǒng)隨機(jī)匹配進(jìn)行PK，用戶(hù)可以天馬行空自由出題，并作為評(píng)委主觀評(píng)判和投票。如果大模型不小心“自報(bào)家門(mén)”，則對(duì)話(huà)被過(guò)濾，不計(jì)入成績(jī)。通過(guò)成千上萬(wàn)輪PK挑戰(zhàn)和用戶(hù)投票，系統(tǒng)將對(duì)大模型進(jìn)行自動(dòng)排名。

AI奇點(diǎn)網(wǎng)了解到，Compass Arena由上海人工智能實(shí)驗(yàn)室OpenCompass司南評(píng)測(cè)體系與魔搭社區(qū)聯(lián)合建設(shè)，前者負(fù)責(zé)組織評(píng)測(cè)，后者負(fù)責(zé)開(kāi)源模型引入及社區(qū)打造。據(jù)上海人工智能實(shí)驗(yàn)室OpenCompass團(tuán)隊(duì)介紹，Compass Arena力求體現(xiàn)社區(qū)用戶(hù)的真實(shí)反饋，評(píng)測(cè)機(jī)制借鑒Chatbot Arena，采用Elo評(píng)分系統(tǒng)，即國(guó)際象棋等對(duì)弈活動(dòng)評(píng)估的權(quán)威標(biāo)準(zhǔn)。

在這種模式下，大模型競(jìng)技類(lèi)似“在游戲中打排位”，勝率成為評(píng)估模型水平的關(guān)鍵指標(biāo)，同時(shí)隨著排位變高，系統(tǒng)也會(huì)自動(dòng)匹配高段位選手進(jìn)行對(duì)戰(zhàn)。

與海外的Chatbot Arena大模型競(jìng)技場(chǎng)相比，國(guó)產(chǎn)的Compass Arena更聚焦中文大模型，主流國(guó)產(chǎn)大模型全覆蓋，同時(shí)評(píng)測(cè)用戶(hù)大多使用中文，可以充分評(píng)估國(guó)產(chǎn)大模型的性能。

目前，Compass Arena已匯聚國(guó)內(nèi)超過(guò)20款的商業(yè)及社區(qū)開(kāi)源大模型，其中不乏來(lái)自BAT的大廠模型。包括Qwen-Max、ERNIE-4.0-8K、Spark3.5 Max、Abab6.5、GLM4等國(guó)內(nèi)頭部人工智能開(kāi)發(fā)商的旗艦款大模型，并引入了海外的Llama3、Mixtral AI等海外標(biāo)桿模型進(jìn)行參照。

未來(lái)，更多模型及廠商還在不斷加入中。

入選Compass Arena大模型競(jìng)技場(chǎng)的首批國(guó)產(chǎn)大模型名單如下：