騰訊副總裁:騰訊混元大模型部分中文能力已追平GPT-4,將推出AI助理APP“元寶”
AI奇點(diǎn)網(wǎng)5月17日?qǐng)?bào)道丨5月17日,騰訊在生成式AI產(chǎn)業(yè)應(yīng)用峰會(huì)上,集中披露了包括底層的通用模型、行業(yè)大模型的能力升級(jí),以及多個(gè)新產(chǎn)品。騰訊集團(tuán)副總裁蔣杰在騰訊云生成式AI產(chǎn)業(yè)應(yīng)用峰會(huì)上表示,騰訊混元大模型經(jīng)過(guò)持續(xù)迭代,目前整體性能居國(guó)內(nèi)第一梯隊(duì),部分中文能力追平GPT-4。
自2023年9月首次亮相以來(lái),騰訊混元大模型不斷探索最新技術(shù),已拓展至萬(wàn)億規(guī)模,并在國(guó)內(nèi)率先采用混合專家模型(MoE)結(jié)構(gòu),帶來(lái)模型總體性能的升級(jí),相比上一代Dense模型提升50%。此外,針對(duì)不同場(chǎng)景需求,騰訊混元在中小型模型方面同樣積極部署,研發(fā)了1B、3B、7B、13B等不同參數(shù)量下的 Dense 和 MoE 模型。
在多模態(tài)能力方面,騰訊混元大模型也取得不少成果。在生圖領(lǐng)域,騰訊混元文生圖基礎(chǔ)架構(gòu)已全面升級(jí)至 sora 同款的 DiT 架構(gòu),支持中英文雙語(yǔ)輸入及理解,具備多輪繪圖能力,測(cè)評(píng)結(jié)果國(guó)內(nèi)領(lǐng)先;在生視頻領(lǐng)域,騰訊混元支持文生視頻、圖生視頻、圖文生視頻、視頻生視頻等多種視頻生成能力,視頻生成長(zhǎng)度可達(dá) 16秒;在生3D層面,騰訊混元已布局文/圖生3D,單圖僅需30秒即可生成3D模型。
據(jù)了解,這些模型能力將通過(guò)騰訊云API對(duì)外開放,以滿足企業(yè)客戶及開發(fā)者在不同場(chǎng)景下的模型需求,讓大模型能力真正落地到產(chǎn)業(yè)應(yīng)用中。在騰訊云上,混元大模型提供了萬(wàn)億參數(shù)hunyuan-pro、千億參數(shù)hunyuan-standard以及百億參數(shù)的hunyuan-lite等多種尺寸的模型服務(wù),其中 hunyuan-standard 模型具備 256k 的超長(zhǎng)上下文理解能力,單次處理字符數(shù)超過(guò)38萬(wàn)個(gè)。
蔣杰表示,為更好地為用戶提供服務(wù),基于混元大模型打造的C端助手App騰訊元寶也將于5月30號(hào)發(fā)布。