4000億開源大模型「天工3.0」正式上線丨國內(nèi)首個(gè)音樂模型「天工SkyMusic」上線丨波士頓動力發(fā)布電動人形機(jī)器人
AI奇點(diǎn)網(wǎng)2024年4月18日報(bào)道丨AI資訊早報(bào)
4月17日,國內(nèi)領(lǐng)先的人工智能大模型開發(fā)機(jī)構(gòu)昆侖萬維重磅推出4000億參數(shù)的開源大模型「天工3.0」,其采用MoE(混合專家模型)架構(gòu),相比2個(gè)月前的天工2.0,邏輯推理、語義理解、復(fù)雜需求應(yīng)對、內(nèi)容創(chuàng)作等4大核心能力大幅提升。
天工3.0新增了圖表對比生成、研究模式、增強(qiáng)模式、擴(kuò)圖修圖等功能,并針對性地訓(xùn)練了模型的Agent能力,使得模型能夠“獨(dú)立思考”,規(guī)劃、拆解用戶需求,完成復(fù)雜任務(wù)。
天工3.0參數(shù)規(guī)模達(dá)到4000億級,是全球最大規(guī)模的開源MoE大模型。相較于上一代,天工3.0的模型技術(shù)知識能力提升超過20%,數(shù)學(xué)、推理、代碼、文創(chuàng)能力提升超過30%。
天工3.0基座大模型在邏輯推理能力、語義理解能力、應(yīng)對復(fù)雜需求能力和內(nèi)容創(chuàng)作能力4個(gè)方面大幅提升。作為多模態(tài)大模型,天工3.0集成了AI搜索、AI寫作、AI長文本閱讀、AI圖片生成、AI音樂生成等功能,在MMBench等多項(xiàng)權(quán)威多模態(tài)測評結(jié)果中超越GPT-4V。
近期,海外的音樂生成產(chǎn)品Suno、Udio爆火,AI音樂生成領(lǐng)域受到了前所未有的關(guān)注。昆侖萬維基于「天工3.0」打造的「天工SkyMusic」也是中國首個(gè)音樂AIGC SOTA(領(lǐng)域最佳水準(zhǔn)),其采用音樂音頻領(lǐng)域類Sora模型架構(gòu),是國內(nèi)唯一公開可用的音樂生成大模型。
基于天工3.0打造的天工SkyMusic,不僅是目前國內(nèi)唯一公開可用的AI音樂生成大模型,而且在人聲&BGM音質(zhì)、人聲自然度、發(fā)音可懂度等性能方面,以6.65分的綜合得分超越Suno V3.成為全球AI音樂SOTA模型。
天工SkyMusic可以生成80秒44100Hz采樣率雙聲道立體聲歌曲,支持生成說唱、民謠、放克、古風(fēng)、電子等多種音樂風(fēng)格,還能學(xué)習(xí)顫音、歌劇、吟唱、男女對唱、自動和聲等歌唱技巧。
天工SkyMusic大幅降低了音樂創(chuàng)作門檻,雖然仍處于起步階段,但其已經(jīng)在音樂生成領(lǐng)域取得了不錯(cuò)的效果。4月初開啟邀測后,天工SkyMusic后臺提交測試申請的人次超百萬。
當(dāng)?shù)貢r(shí)間 4 月 17日,就在剛剛宣布退役其首款液壓人形機(jī)器人 Atlas 的第二天,知名的機(jī)器人研發(fā)公司“波士頓動力”對外發(fā)布了一款全新的純電動驅(qū)動的人形機(jī)器人。新一代 Atlas 機(jī)器人擁有比前輩更廣的運(yùn)動范圍,能夠勝任更多任務(wù)。
波士頓動力表示,他們希望通過新版 Atlas 機(jī)器人證明,人形外形并不會限制機(jī)器人的雙足移動能力。新版機(jī)器人的關(guān)節(jié)經(jīng)過了重新設(shè)計(jì),可以靈活旋轉(zhuǎn),據(jù)稱能夠“勝任乏味、臟污和危險(xiǎn)的任務(wù)”。
新版 Atlas 的外形也更接近人類。和特斯拉的 Optimus 機(jī)器人一樣,新版 Atlas 擁有更長的四肢、更直的背部,以及可以根據(jù)需要旋轉(zhuǎn)的頭部。機(jī)器人身上看不到任何電線,它的“臉部”還內(nèi)置了環(huán)形燈。相比于前輩,這無疑是一次巨大進(jìn)步,新版機(jī)器人搭載了眾多波士頓動力公司新的人工智能和機(jī)器學(xué)習(xí)工具。
波士頓動力表示,未來幾年,他們將與一小部分客戶(首家為其母公司現(xiàn)代汽車)共同測試新版 Atlas 機(jī)器人。
當(dāng)?shù)貢r(shí)間4月16日,據(jù)外媒消息,谷歌的桌面瀏覽器 Chrome 地址欄即將添加一種 Gemini 大模型的快捷方式調(diào)用方式。用戶可以在 Chrome 瀏覽器內(nèi)登錄自己的賬號后,就可以快捷地跳轉(zhuǎn)到 Gemini 網(wǎng)頁上進(jìn)行聊天機(jī)器人的使用。
具體來說,用戶只需在地址欄輸入 @gemini 即可調(diào)起谷歌的AI機(jī)器人,與聊天機(jī)器人 Gemini 開始聊天。
該功能目前正在 Chrome 瀏覽器 Canary 測試版中進(jìn)行測試,地址欄下拉菜單底部會出現(xiàn)提醒「輸入 @gemini 與 Gemini 聊天」。目前該功能僅適用于 Chrome 瀏覽器內(nèi)測的 Canary 125 版本。
當(dāng)?shù)貢r(shí)間4月16日,據(jù)外媒The Information報(bào)道,歐洲AI創(chuàng)業(yè)公司Mistral近期正計(jì)劃以50億美元的估值籌集數(shù)億美元資金。Mistral主要向使用API調(diào)用訪問其大模型來向客戶收費(fèi)。
創(chuàng)立于2023年的Mistral,由前DeepMind和Meta離職的科學(xué)家們聯(lián)合創(chuàng)辦,該公司研發(fā)的大模型以O(shè)penAI為對標(biāo),并于今年2月推出了與GPT-4競爭的Mistral Large模型,并先后腳獲得了微軟的投資。目前尚不清楚哪些投資者會參與Mistral的新一輪融資。
Mistral致力于構(gòu)建一個(gè)透明和公開的形象,其命名靈感來源于北方冬季的風(fēng)。與OpenAI采取的策略不同,Mistral公司正在將其模型開源,并表示他們的產(chǎn)品正在根據(jù)歐洲對這類軟件更嚴(yán)格的安全開發(fā)規(guī)定來開發(fā)。