字節(jié)豆包大模型升級(jí),綜合能力提升20.3%丨微軟發(fā)布Phi-3.5系列迷你模型丨IDC發(fā)布中國大模型應(yīng)用份額報(bào)告:百度居首
AI奇點(diǎn)網(wǎng)2024年8月22日?qǐng)?bào)道丨AI資訊早報(bào)
8 月 21 日,字節(jié)跳動(dòng)旗下的大數(shù)據(jù)運(yùn)營商火山引擎 AI 創(chuàng)新巡展在上海舉辦。在此次會(huì)議上,火山引擎發(fā)布了豆包大模型的一系列產(chǎn)品升級(jí)。
5月15日正式對(duì)外發(fā)布以來,豆包大模型的日均 Tokens 使用量已經(jīng)超過5,000億,平均企業(yè)客戶使用量增長了22倍。
基于內(nèi)外客戶廣泛、真實(shí)的業(yè)務(wù)需求,豆包大模型在關(guān)鍵能力上不斷迭代優(yōu)化。公開及內(nèi)部測(cè)評(píng)集顯示,最新版豆包大語言模型相比發(fā)布初期綜合能力提升了20.3%。其中,角色扮演能力提升了38.3%,具備了更強(qiáng)的上下文感知,讓對(duì)話情境更連貫、角色更擬人化。
語言理解能力提升了33.3%,讓豆包大模型在信息分類、抽取、摘要、理解和問答等 NLP 方面都有了顯著提升,能夠在更多生產(chǎn)力場(chǎng)景中得到應(yīng)用。此外,模型在長文任務(wù)、數(shù)學(xué)、專業(yè)知識(shí)、代碼能力上也有不同程度的增強(qiáng)。
本次活動(dòng)上,字節(jié)方面還公布了多個(gè)豆包大模型的垂類模型的最新升級(jí)情況,包括:
其中,豆包·文生圖模型對(duì)長文本有更精準(zhǔn)的圖文匹配能力,多主體、多位置、手部結(jié)構(gòu)等復(fù)雜場(chǎng)景的生圖能力更強(qiáng),更善于理解中國特色元素,創(chuàng)造更具美感的中國風(fēng)圖片。
豆包·語音識(shí)別模型基于大語言模型豐富的知識(shí)和推理能力,通過上下文感知,提升語音識(shí)別準(zhǔn)確性,在多個(gè)公開測(cè)試集中,與國內(nèi)公開發(fā)布的語音識(shí)別大模型相比,錯(cuò)誤率最高降低40%;支持一個(gè)模型識(shí)別普通話和粵語、上海話、四川話、西安話、閩南語等方言。豆包·語音合成模型升級(jí)了流式語音合成能力,能夠?qū)崟r(shí)響應(yīng)、精準(zhǔn)斷句,支持“邊想邊說”。
8 月 21 日,火山引擎 AI 創(chuàng)新巡展在上海舉辦。在此次會(huì)議上,火山引擎發(fā)布了豆包大模型的一系列產(chǎn)品升級(jí),并攜手多點(diǎn) DMALL 成立零售大模型生態(tài)聯(lián)盟,基于豆包大模型打造零售 AI 解決方案,提升消費(fèi)者購物體驗(yàn)。
火山引擎總裁譚待認(rèn)為,大模型應(yīng)用落地不僅需要技術(shù)成熟度,還要有適配的商業(yè)組織和商業(yè)生態(tài)。為此,火山引擎與商超、餐飲、食品、服裝等眾多行業(yè)領(lǐng)軍企業(yè)合作,共同成立零售大模型生態(tài)聯(lián)盟。
火山引擎總裁譚待表示,豆包大模型獲得眾多行業(yè)客戶青睞,本次大模型生態(tài)聯(lián)盟的首批成員包括:物美集團(tuán)、抖音電商、抖音生活服務(wù)、百勝、麥當(dāng)勞、中國飛鶴、海底撈、居然之家等知名企業(yè)。
當(dāng)?shù)貢r(shí)間8月20日晚間,微軟公司今天發(fā)布了三款小參數(shù)尺寸的 Phi-3.5 系列 AI 大模型,其中最值得關(guān)注的是推出了該系列首個(gè)混合專家模型(MoE)版本的 Phi-3.5-MoE。
Phi-3.5-vision 共有 42 億個(gè)參數(shù),使用 256 個(gè) A100 GPU 在 500B 標(biāo)記上進(jìn)行訓(xùn)練,現(xiàn)在支持多幀圖像理解和推理。
本次發(fā)布的 Phi-3.5 系列包括 Phi-3.5-MoE、Phi-3.5-vision 和 Phi-3.5-mini 三款輕量級(jí)針對(duì)端側(cè)設(shè)備提供的 AI 大模型,基于合成數(shù)據(jù)和經(jīng)過過濾的公開網(wǎng)站構(gòu)建,上下文窗口為 128K,所有模型現(xiàn)在都可以在大模型在線體驗(yàn)社區(qū) Hugging Face 上以 MIT 開源許可的方式獲取。
Phi-3.5-MoE 是 Phi 系列中首個(gè)利用混合專家(MoE)技術(shù)的模型。該模型在 16 x 3.8B MoE 模型使用 2 個(gè)專家僅激活了 66 億個(gè)參數(shù),并使用 512 個(gè) H100 在 4.9T 標(biāo)記上進(jìn)行了訓(xùn)練。
微軟研究團(tuán)隊(duì)聲稱,這次 Pin-3.5 版本乃從零開始設(shè)計(jì)的新模型,以進(jìn)一步提高其性能。在標(biāo)準(zhǔn)人工智能基準(zhǔn)測(cè)試中,Phi-3.5-MoE 的性能超過了 Llama-3.1 8B、Gemma-2-9B 和 Gemini-1.5-Flash,并接近目前在小尺寸模型領(lǐng)域的領(lǐng)頭羊 GPT-4o mini。
8月20日,《逆水寒》手游官方發(fā)布通告稱,在即將到來的 V2.1.3 版本里,名為「自捏江湖友人」玩法即將上線,《逆水寒》手游將是“業(yè)界首個(gè)可以自捏 AI 智能生命體”的游戲。
新版本上線后,玩家可以點(diǎn)開【呼吸-自捏江湖友人】界面,輸入姓名,即可一鍵完成捏人工作。
此外,玩家可以為江湖友人打造獨(dú)一無二的外貌與聲音。如果心中已有理想形象,可以選擇掃碼導(dǎo)入裝扮站的現(xiàn)有外觀;也可以在征得他人的同意后,通過掃碼復(fù)制他人分享的門客的形象和人物特征為己所用。
8月21日,國際數(shù)據(jù)公司IDC首次對(duì)外發(fā)布了針對(duì) 2023 全年的《中國大模型平臺(tái)市場(chǎng)份額,2023:大模型元年 —— 初局》市場(chǎng)調(diào)研報(bào)告。
數(shù)據(jù)顯示,2023 年中國大模型平臺(tái)及相關(guān)應(yīng)用市場(chǎng)規(guī)模達(dá) 17.65 億元人民幣。在過去的一年中,行業(yè)對(duì)于大模型更多的是早期投入,甚至觀望而不重投入,因此 2023 年整體市場(chǎng)規(guī)模并不顯著;并且市場(chǎng)格局也主要還是由早期投入者,比如百度、商湯、智譜、百川智能等公司構(gòu)成。
進(jìn)入 2024 年,頭部的互聯(lián)網(wǎng)公司加大對(duì)大模型的投入且發(fā)起價(jià)格戰(zhàn),為早期的大模型初創(chuàng)企業(yè)帶來一定的競(jìng)爭(zhēng)壓力。預(yù)計(jì)未來兩到三年,市場(chǎng)格局將發(fā)生多輪巨變。
2023 年中國大模型平臺(tái)及應(yīng)用市場(chǎng)份額如下:
據(jù)外媒報(bào)道,今日 Meta 悄悄地發(fā)布了一款新的網(wǎng)絡(luò)爬蟲,用于搜索互聯(lián)網(wǎng)并收集大量數(shù)據(jù),為其人工智能模型提供支持。
據(jù)三家追蹤網(wǎng)絡(luò)抓取器的公司稱,Meta 新網(wǎng)絡(luò)爬蟲機(jī)器人 Meta External Agent 于上月推出,類似于 OpenAI 的 GPTBot,可以抓取網(wǎng)絡(luò)上的人工智能訓(xùn)練數(shù)據(jù),例如新聞文章中的文本或在線討論組中的對(duì)話。
新爬蟲的存在表明 Meta 龐大的數(shù)據(jù)庫可能已經(jīng)不夠用了,因?yàn)樵摴纠^續(xù)致力于更新 Llama 和擴(kuò)展 Meta AI,通常需要新的和高質(zhì)量的培訓(xùn)數(shù)據(jù)來不斷改進(jìn)功能。