OpenAI高層劇震,三位高層宣布離職和隱身丨即夢(mèng)AI推出移動(dòng)客戶端丨Figure發(fā)布新一代人形機(jī)器人「Figure 02」
AI奇點(diǎn)網(wǎng)2024年8月7日?qǐng)?bào)道丨AI資訊早報(bào)
在去年11月經(jīng)歷了震驚科技圈的「高層宮斗風(fēng)波」后,全球矚目的人工智能企業(yè)OpenAI的人事動(dòng)蕩問題持續(xù)延燒,始終未能完全平息。
近日,OpenAI總裁Greg Brockman宣布長期休假,很久都沒有出現(xiàn)在辦公室。而公司的另外兩位高管——聯(lián)合創(chuàng)始人之一的Johnson Schulman以及人工智能產(chǎn)品負(fù)責(zé)人Peter Deng離職,引發(fā)對(duì)OpenAI團(tuán)隊(duì)狀況的猜測(cè)。
根據(jù)媒體的統(tǒng)計(jì),截止目前8月份,回溯OpenAI公司于2015年成立之初的首批初創(chuàng)成員中,只剩下CEO山姆·奧特曼、Wojciech Zaremba以及奧特曼的“好哥們Greg Brockman仍然在公司報(bào)道。
OpenAI的大部分離職員工均投身到其他的競爭對(duì)手公司或者人工智能創(chuàng)業(yè)公司,比如谷歌Deepmind和開發(fā)Claude機(jī)器人的Anthrophic。不太和諧的公司團(tuán)隊(duì)士氣和外界對(duì)公司的關(guān)注度讓這家初創(chuàng)企業(yè)面臨了十分嚴(yán)峻的危機(jī)。
從產(chǎn)品端的角度來看,OpenAI也面臨著重重的壓力。目前還未能拿出下一代大語言模型GPT-5的發(fā)布時(shí)間表,而奧特曼等高層則不斷強(qiáng)調(diào)該模型強(qiáng)到令人難以想象。除此之外,今年春節(jié)發(fā)布的Sora視頻模型,目前依然未能實(shí)現(xiàn)商用化。
字節(jié)跳動(dòng)旗下的剪映團(tuán)隊(duì)開發(fā)的一站式AI創(chuàng)作平臺(tái)“即夢(mèng)AI”,可以幫助用戶通過AI技術(shù)輕松地生成各種創(chuàng)意作品,包括圖片、視頻等。“即夢(mèng)AI”近日正式發(fā)布針對(duì)手機(jī)用戶的移動(dòng)版本APP,目前已經(jīng)上架蘋果 App Store及安卓各大應(yīng)用商店。
這款 App 由剪映、醒圖團(tuán)隊(duì)(臉萌科技)研發(fā),采用內(nèi)購模式,會(huì)員服務(wù)按月或年收費(fèi)。
圖像創(chuàng)作
視頻創(chuàng)作
8月7日消息,AI人形機(jī)器人創(chuàng)業(yè)公司Figure宣布其最新一代產(chǎn)品——Figure 02人形機(jī)器人正式發(fā)布。據(jù)介紹,這是一款集機(jī)載算力、視覺推理、語音交互于一體的高端人形AI機(jī)器人。
經(jīng)過日前簡單的預(yù)熱,這家由微軟、英偉達(dá)、OpenAI聯(lián)合投資的人形機(jī)器人明星企業(yè)如期發(fā)布最新款人形機(jī)器人Figure 02。
Figure 02 行走間雖有顛簸,但速度也算的上中規(guī)中矩,與背景里拿著工廠零部件的同類機(jī)器人相映成趣。
在性能提升上,F(xiàn)igure 02人形機(jī)器人全身裝備了6個(gè)RGB攝像頭,分別位于頭部、胸前和后背,配合AI驅(qū)動(dòng)的視覺系統(tǒng),能夠?qū)崿F(xiàn)對(duì)真實(shí)物理世界的精準(zhǔn)感知和理解。此外,F(xiàn)igure 02還搭載了機(jī)載的視覺語言模型(VLM),使其具備了快速的常識(shí)性視覺推理能力,能夠自主執(zhí)行多種復(fù)雜任務(wù)。
值得一提的是,F(xiàn)igure 02在語音交互方面也取得了顯著進(jìn)步。機(jī)器人內(nèi)置了OpenAI定制的語音到語音推理模型,通過機(jī)載麥克風(fēng)和揚(yáng)聲器,實(shí)現(xiàn)了與人類的高效對(duì)話。
基于機(jī)載算力和各個(gè)組件的全方位升級(jí),AI人形機(jī)器人朝著“進(jìn)廠打工”又邁進(jìn)了一大步。隨著人工智能大模型的飛躍式發(fā)展,這款被不少媒體稱為“地表最強(qiáng)人形機(jī)器人”的AI設(shè)備,也已經(jīng)具備視覺推理和聊天溝通的能力——操作機(jī)器人的默認(rèn)UI就是語音控制。
8月6日,國內(nèi)人工智能創(chuàng)業(yè)公司智譜AI宣布對(duì)外開源了旗下的“智譜清影”視頻生成工具背后的視頻生成大模型CogVideoX,這是全球首個(gè)可商用的開源視頻大模型。這款大模型在GitHub開源社區(qū)發(fā)布僅5小時(shí),便獲得了3.7K的星星點(diǎn)贊數(shù)值。
CogVideoX是一款「類Sora」的文生視頻大模型,它就像一位創(chuàng)意十足的導(dǎo)演,能夠根據(jù)你提供的文字描述,自動(dòng)生成一段生動(dòng)的視頻。輸入一段文字描述,CogVideoX就能生成對(duì)應(yīng)的視頻。無論是簡單的場(chǎng)景描述,還是復(fù)雜的故事情節(jié),它都能勝任。
CogVideoX提供一下的能力:
智譜AI的CogVideoX包含多個(gè)不同參數(shù)尺寸,此次開源的是CogVideoX-2B 20億版本,推理僅需18GB的顯存,民用級(jí)顯卡即可實(shí)現(xiàn)。該模型已支持在HuggingFace的Diffusers庫中部署。智譜AI的技術(shù)報(bào)告提出了一系列新的算法和處理方式,包括三維變分自編碼器結(jié)構(gòu)、專家Transformer等。
當(dāng)?shù)貢r(shí)間8月6日,OpenAI宣布將在2024年10月1日起,在舊金山、倫敦和新加坡多地舉行2024年度DevDay活動(dòng),增加各地的開發(fā)者參與度。與以往不同,本次大會(huì)將不發(fā)布新的 AI 模型,而是專注于 API 和開發(fā)者工具的更新與優(yōu)化。
此次活動(dòng)將重點(diǎn)關(guān)注API和開發(fā)工具的改進(jìn),包括實(shí)踐技術(shù)課程、分組研討會(huì)、產(chǎn)品演示、開發(fā)人員聚焦和晚間招待會(huì)。然而,公司表示本次活動(dòng)不會(huì)發(fā)布新的AI前沿模型。大會(huì)將重點(diǎn)關(guān)注如何更好地支持開發(fā)者利用 OpenAI 的 API 和工具,構(gòu)建出更加出色的 AI 應(yīng)用。