基準(zhǔn)測(cè)評(píng)國(guó)內(nèi)第一:百川智能發(fā)布新一代大模型Baichuan 4,發(fā)布旗下首款A(yù)I智能搜索助理「百小應(yīng)」
AI奇點(diǎn)網(wǎng)5月23日?qǐng)?bào)道丨5月22日,百川智能在北京總部舉行了一場(chǎng)媒體溝通會(huì),對(duì)外發(fā)布了新一代基座大模型——Baichuan 4,并基于該版本的基礎(chǔ)大模型,打造了該公司成立之后的首款A(yù)I助手應(yīng)用“百小應(yīng)”,這是一款類AI搜索的產(chǎn)品。
Baichuan 4相較Baichuan 3在各項(xiàng)能力上均有極大提升,其中通用能力提升超過10%,數(shù)學(xué)和代碼能力分別提升14%和9%,在國(guó)內(nèi)權(quán)威大模型評(píng)測(cè)機(jī)構(gòu)SuperCLUE的評(píng)測(cè)中,模型能力國(guó)內(nèi)第一。
此外,Baichun 4還具備行業(yè)領(lǐng)先的多模態(tài)能力,在各大評(píng)測(cè)基準(zhǔn)上表現(xiàn)優(yōu)異,領(lǐng)先Gemini 1.5 Pro、Claude 3-Sonnet等多模態(tài)模型。
在Baichuan 4強(qiáng)大能力的基礎(chǔ)上,百川智能將搜索技術(shù)與大模型深度融合,推出懂搜索、會(huì)提問的AI助手“百小應(yīng)”。
百小應(yīng)不僅可以隨時(shí)回答用戶提出的各種問題,速讀文件、整理資料、輔助創(chuàng)作等,還具備多輪搜索、定向搜索等搜索能力,能更精準(zhǔn)地理解用戶需求,為用戶提供專業(yè)、豐富的知識(shí)和資源。此外還會(huì)在用戶問題的基礎(chǔ)上通過一系列提問來幫助用戶明確自身需求,給出更精準(zhǔn)的答案。百小應(yīng)現(xiàn)在已經(jīng)在Web端(ying.ai)及移動(dòng)端各大應(yīng)用商店同步上線。
作為百川智能發(fā)布的最新一代基座大模型,Baichuan 4在國(guó)內(nèi)權(quán)威大模型評(píng)測(cè)機(jī)構(gòu)SuperCLUE的評(píng)測(cè)中,模型能力國(guó)內(nèi)第一,相較上一代大模型Baichuan 3提升顯著。
不僅如此,與國(guó)外主流大模型對(duì)比,Baichuan4在知識(shí)百科、長(zhǎng)文本、生成創(chuàng)作等文科類中文任務(wù)上明顯優(yōu)于國(guó)外大模型。
Baichuan 4能在較短的時(shí)間內(nèi)取得突破,源于其在訓(xùn)練過程中引入了諸多業(yè)界領(lǐng)先的技術(shù)優(yōu)化手段。
例如,在預(yù)訓(xùn)練階段采用了基于Model-based+Human-based的協(xié)同數(shù)據(jù)篩選優(yōu)化方法,以及對(duì)長(zhǎng)文本建模位置編碼科學(xué)的Scaling Law,有效提升了模型對(duì)數(shù)據(jù)的利用;在對(duì)齊階段重點(diǎn)優(yōu)化了模型Reasoning、Planning、Instruct following能力,通過loss驅(qū)動(dòng)的數(shù)據(jù)選取與訓(xùn)練,多階段爬坡,多模型參數(shù)融合等方式有效提升了模型的關(guān)鍵指標(biāo)和穩(wěn)定性。同時(shí)突破RLHF和RLAIF融合的RLxF強(qiáng)化學(xué)習(xí)對(duì)齊技術(shù),大幅提升模型的指令遵循等能力。
此外,Baichuan 4還具備行業(yè)領(lǐng)先的多模態(tài)能力,在MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista等評(píng)測(cè)基準(zhǔn)上表現(xiàn)優(yōu)異,大幅領(lǐng)先Gemini Pro、Claude3-sonnet等多模態(tài)模型。
“百小應(yīng)”是百川智能成立之后推出的首款A(yù)I應(yīng)用,在此之前,百川智能一直專注以開源大模型的開發(fā)與訓(xùn)練。
百川智能認(rèn)為,不同于信息時(shí)代工具屬性的產(chǎn)品,大模型創(chuàng)造的是新物種,讓AI從工具變?yōu)榛锇椤km然受限于模型能力,當(dāng)下的AI應(yīng)用還無法完全做到如同人一樣,能夠使用工具、會(huì)思考、有情感等,但隨著模型能力的持續(xù)提升,相關(guān)應(yīng)用一定會(huì)逐步具備完整能力。
為了讓用戶能夠擁有更優(yōu)質(zhì)的智能體驗(yàn),“百小應(yīng)”很好地融合了Baichan 4行業(yè)領(lǐng)先的通用能力與百川智能前沿的搜索技術(shù),具備多步搜索、智能定向搜索等能力,將百小應(yīng)打造成一款懂搜索、會(huì)提問的AI助手。
多輪搜索指的是針對(duì)用戶提出的問題,“百小應(yīng)”逐步解析,深入探究,解鎖問題的核心答案。相比單輪搜索,在市場(chǎng)調(diào)研、產(chǎn)業(yè)分析等復(fù)雜場(chǎng)景下,多輪搜索能夠有效地獲取更專業(yè)、更有深度的信息。定向搜索則能讓百小應(yīng)精準(zhǔn)定位問題領(lǐng)域,直接訪問權(quán)威站點(diǎn),快速、準(zhǔn)確的找到相關(guān)信息。
在搜索結(jié)果呈現(xiàn)方面,“百小應(yīng)”同樣與其他在單次搜索后“簡(jiǎn)單總結(jié)網(wǎng)頁信息”的應(yīng)用不同,它是將搜索結(jié)果作為觀點(diǎn)、論據(jù)直接應(yīng)用到問答結(jié)果中。與此同時(shí),其結(jié)果的結(jié)構(gòu)化也非常優(yōu)秀,能夠?qū)⑺阉鹘Y(jié)果以表格等結(jié)構(gòu)化形式呈現(xiàn),優(yōu)化信息布局,便于用戶快速定位、解讀所需信息,可以為行業(yè)分析、調(diào)研工作提供強(qiáng)大助力。
此外,“百小應(yīng)”還在搜索結(jié)果中增加了來源參考,用戶只需點(diǎn)擊引用角標(biāo)即可快速校驗(yàn)搜索結(jié)果,十分便捷。
不僅如此,針對(duì)一部分用戶無法明確表述出自身需求,或者問題過于籠統(tǒng)、抽象的情況,“百小應(yīng)”還貼心的用提問功能構(gòu)建了個(gè)性化解決方案,“百小應(yīng)”會(huì)在用戶問題的基礎(chǔ)上通過一系列提問來幫助用戶明確自身需求,然后再給出更精準(zhǔn)的答案。
除了強(qiáng)大的搜索和提問功能以外,用戶還能在“百小應(yīng)”中上傳PDF、Word文檔,或者直接輸入網(wǎng)頁鏈接,閱讀并分析書籍、報(bào)告、學(xué)術(shù)論文等長(zhǎng)篇內(nèi)容,僅用一分鐘便能讀完上市公司財(cái)報(bào)。
在Baichuan 4多模態(tài)能力的支持下,用戶在提問的同時(shí)還可以同步上傳圖片,對(duì)圖片內(nèi)容進(jìn)行解讀,或者將圖片作為補(bǔ)充材料,獲取更精準(zhǔn)的回答;并且,它還支持用戶通過語音的方式進(jìn)行交互。
根據(jù)百川智能的介紹,“百小應(yīng)”的命名源自于中國(guó)成語“一呼百應(yīng)”,寓意有溫度的人工智能。
百川智能認(rèn)為,企業(yè)客戶需要的并不是大模型,而是生產(chǎn)力、生產(chǎn)效率的提升,擁有 MaaS+ AaaS(Agent as a service)雙重能力,企業(yè)才能構(gòu)建出智能化的最佳方案。
秉持這一理念,百川智能推出了全新的MaaS+AaaS服務(wù)。
MaaS版塊由基座模型組成,分為旗艦版和專業(yè)版。旗艦版將全量開放Baichuan 4的各項(xiàng)能力,Baichuan 4不僅擁有國(guó)內(nèi)第一的中文能力,并且具備行業(yè)領(lǐng)先的金融知識(shí)和問答能力,在SuperCLUE的金融知識(shí)百科能力上Baichuan 3就已取得了A+的最高評(píng)級(jí)。
專業(yè)版包含Baichuan3-Turbo和Baichuan3-Turbo-128K兩款模型,在價(jià)格方面相比旗艦版Baichuan 4更實(shí)惠,且均針對(duì)企業(yè)用的高頻場(chǎng)景進(jìn)行了針對(duì)性優(yōu)化,綜合測(cè)試相比GPT-3.5整體效果提升8.9%。百川智能表示,即日起,MaaS 的新用戶可以獲得1000萬免費(fèi)token。
未來,百川智能還計(jì)劃推出零代碼Agent創(chuàng)建平臺(tái)產(chǎn)品,讓業(yè)務(wù)人員通過自然語言的方式,也能創(chuàng)建AI Agent,更好地賦能企業(yè)智能化發(fā)展。
在發(fā)布會(huì)的最后,百川智能不忘給各位媒體介紹一下自己目前已經(jīng)獲得的客戶名錄。據(jù)稱已經(jīng)服務(wù)了數(shù)千家客戶, 包括完美世界游戲、愛奇藝、 創(chuàng)夢(mèng)、什么值得買等各行業(yè)的領(lǐng)軍企業(yè),并且與信雅達(dá)、用友、軟通動(dòng)力、新致軟件、達(dá)觀數(shù)據(jù)等多家行業(yè)生態(tài)伙伴,以及華為、曙光等硬件廠商和中國(guó)移動(dòng)、電信、聯(lián)通等運(yùn)營(yíng)商達(dá)成了合作,攜手構(gòu)建百川大模型生態(tài)。