亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁  >  資訊  >  文章
2024-08-07 08:59

OpenAI高層劇震,三位高層宣布離職和隱身丨即夢(mèng)AI推出移動(dòng)客戶端丨Figure發(fā)布新一代人形機(jī)器人「Figure 02」

AI奇點(diǎn)網(wǎng)2024年8月7日?qǐng)?bào)道丨AI資訊早報(bào)

OpenAI高層劇震,三位高層宣布離職和隱身

在去年11月經(jīng)歷了震驚科技圈的「高層宮斗風(fēng)波」后,全球矚目的人工智能企業(yè)OpenAI的人事動(dòng)蕩問題持續(xù)延燒,始終未能完全平息。

近日,OpenAI總裁Greg Brockman宣布長期休假,很久都沒有出現(xiàn)在辦公室。而公司的另外兩位高管——聯(lián)合創(chuàng)始人之一的Johnson Schulman以及人工智能產(chǎn)品負(fù)責(zé)人Peter Deng離職,引發(fā)對(duì)OpenAI團(tuán)隊(duì)狀況的猜測(cè)。

根據(jù)媒體的統(tǒng)計(jì),截止目前8月份,回溯OpenAI公司于2015年成立之初的首批初創(chuàng)成員中,只剩下CEO山姆·奧特曼、Wojciech Zaremba以及奧特曼的“好哥們Greg Brockman仍然在公司報(bào)道。

OpenAI的大部分離職員工均投身到其他的競爭對(duì)手公司或者人工智能創(chuàng)業(yè)公司,比如谷歌Deepmind和開發(fā)Claude機(jī)器人的Anthrophic。不太和諧的公司團(tuán)隊(duì)士氣和外界對(duì)公司的關(guān)注度讓這家初創(chuàng)企業(yè)面臨了十分嚴(yán)峻的危機(jī)。

從產(chǎn)品端的角度來看,OpenAI也面臨著重重的壓力。目前還未能拿出下一代大語言模型GPT-5的發(fā)布時(shí)間表,而奧特曼等高層則不斷強(qiáng)調(diào)該模型強(qiáng)到令人難以想象。除此之外,今年春節(jié)發(fā)布的Sora視頻模型,目前依然未能實(shí)現(xiàn)商用化。

字節(jié)跳動(dòng)“即夢(mèng)AI”推出AI視頻創(chuàng)作移動(dòng)客戶端

字節(jié)跳動(dòng)旗下的剪映團(tuán)隊(duì)開發(fā)的一站式AI創(chuàng)作平臺(tái)“即夢(mèng)AI”,可以幫助用戶通過AI技術(shù)輕松地生成各種創(chuàng)意作品,包括圖片、視頻等。“即夢(mèng)AI”近日正式發(fā)布針對(duì)手機(jī)用戶的移動(dòng)版本APP,目前已經(jīng)上架蘋果 App Store及安卓各大應(yīng)用商店。

這款 App 由剪映、醒圖團(tuán)隊(duì)(臉萌科技)研發(fā),采用內(nèi)購模式,會(huì)員服務(wù)按月或年收費(fèi)。

圖像創(chuàng)作

  • 文生圖:輸入一段文字描述,AI就能根據(jù)你的描述生成各種風(fēng)格的圖片,從寫實(shí)到抽象,應(yīng)有盡有。
  • 圖生圖:上傳一張圖片,AI可以基于這張圖片進(jìn)行二次創(chuàng)作,比如改變風(fēng)格、添加元素、或者生成多個(gè)變體。
  • AI拼圖:將多張圖片無縫拼接成一張大圖,風(fēng)格統(tǒng)一和諧。
  • 局部重繪:對(duì)圖片的局部區(qū)域進(jìn)行重新創(chuàng)作,修改細(xì)節(jié)或改變風(fēng)格。
  • 一鍵擴(kuò)圖:將圖片放大,同時(shí)保持畫質(zhì)和細(xì)節(jié)。
  • 圖像消除和摳圖: 快速去除圖片中的不需要的元素,或者將前景從背景中摳出來。

視頻創(chuàng)作

  • 圖生視頻:將靜態(tài)圖片轉(zhuǎn)化為動(dòng)態(tài)視頻,添加各種特效和轉(zhuǎn)場(chǎng)。
  • 文生視頻:輸入一段文字描述,AI可以生成一段短視頻,包含畫面和聲音。
  • 故事創(chuàng)作:提供多種故事模板和素材,幫助你快速創(chuàng)作出屬于自己的視頻故事。

Figure發(fā)布新一代人形機(jī)器人「Figure 02」

8月7日消息,AI人形機(jī)器人創(chuàng)業(yè)公司Figure宣布其最新一代產(chǎn)品——Figure 02人形機(jī)器人正式發(fā)布。據(jù)介紹,這是一款集機(jī)載算力、視覺推理、語音交互于一體的高端人形AI機(jī)器人。

經(jīng)過日前簡單的預(yù)熱,這家由微軟、英偉達(dá)、OpenAI聯(lián)合投資的人形機(jī)器人明星企業(yè)如期發(fā)布最新款人形機(jī)器人Figure 02。

圖片

Figure 02 行走間雖有顛簸,但速度也算的上中規(guī)中矩,與背景里拿著工廠零部件的同類機(jī)器人相映成趣。

圖片

在性能提升上,F(xiàn)igure 02人形機(jī)器人全身裝備了6個(gè)RGB攝像頭,分別位于頭部、胸前和后背,配合AI驅(qū)動(dòng)的視覺系統(tǒng),能夠?qū)崿F(xiàn)對(duì)真實(shí)物理世界的精準(zhǔn)感知和理解。此外,F(xiàn)igure 02還搭載了機(jī)載的視覺語言模型(VLM),使其具備了快速的常識(shí)性視覺推理能力,能夠自主執(zhí)行多種復(fù)雜任務(wù)。

值得一提的是,F(xiàn)igure 02在語音交互方面也取得了顯著進(jìn)步。機(jī)器人內(nèi)置了OpenAI定制的語音到語音推理模型,通過機(jī)載麥克風(fēng)和揚(yáng)聲器,實(shí)現(xiàn)了與人類的高效對(duì)話。

基于機(jī)載算力和各個(gè)組件的全方位升級(jí),AI人形機(jī)器人朝著“進(jìn)廠打工”又邁進(jìn)了一大步。隨著人工智能大模型的飛躍式發(fā)展,這款被不少媒體稱為“地表最強(qiáng)人形機(jī)器人”的AI設(shè)備,也已經(jīng)具備視覺推理和聊天溝通的能力——操作機(jī)器人的默認(rèn)UI就是語音控制。

智譜AI開源「國產(chǎn)Sora」視頻大模型CogVideoX

8月6日,國內(nèi)人工智能創(chuàng)業(yè)公司智譜AI宣布對(duì)外開源了旗下的“智譜清影”視頻生成工具背后的視頻生成大模型CogVideoX,這是全球首個(gè)可商用的開源視頻大模型。這款大模型在GitHub開源社區(qū)發(fā)布僅5小時(shí),便獲得了3.7K的星星點(diǎn)贊數(shù)值。

CogVideoX是一款「類Sora」的文生視頻大模型,它就像一位創(chuàng)意十足的導(dǎo)演,能夠根據(jù)你提供的文字描述,自動(dòng)生成一段生動(dòng)的視頻。輸入一段文字描述,CogVideoX就能生成對(duì)應(yīng)的視頻。無論是簡單的場(chǎng)景描述,還是復(fù)雜的故事情節(jié),它都能勝任。

CogVideoX提供一下的能力:

  • 視頻生成工具: 可以根據(jù)文本描述或其他輸入生成視頻。
  • 視頻編輯工具: 可以對(duì)視頻進(jìn)行智能化編輯,如自動(dòng)剪輯、添加特效等。
  • 視頻分析工具: 可以對(duì)視頻內(nèi)容進(jìn)行分析,提取關(guān)鍵信息、識(shí)別對(duì)象等。

智譜AI的CogVideoX包含多個(gè)不同參數(shù)尺寸,此次開源的是CogVideoX-2B 20億版本,推理僅需18GB的顯存,民用級(jí)顯卡即可實(shí)現(xiàn)。該模型已支持在HuggingFace的Diffusers庫中部署。智譜AI的技術(shù)報(bào)告提出了一系列新的算法和處理方式,包括三維變分自編碼器結(jié)構(gòu)、專家Transformer等。

OpenAI宣布10月舉行第二屆開發(fā)者大會(huì):但沒有新模型發(fā)布

當(dāng)?shù)貢r(shí)間8月6日,OpenAI宣布將在2024年10月1日起,在舊金山、倫敦和新加坡多地舉行2024年度DevDay活動(dòng),增加各地的開發(fā)者參與度。與以往不同,本次大會(huì)將不發(fā)布新的 AI 模型,而是專注于 API 和開發(fā)者工具的更新與優(yōu)化。

此次活動(dòng)將重點(diǎn)關(guān)注API和開發(fā)工具的改進(jìn),包括實(shí)踐技術(shù)課程、分組研討會(huì)、產(chǎn)品演示、開發(fā)人員聚焦和晚間招待會(huì)。然而,公司表示本次活動(dòng)不會(huì)發(fā)布新的AI前沿模型。大會(huì)將重點(diǎn)關(guān)注如何更好地支持開發(fā)者利用 OpenAI 的 API 和工具,構(gòu)建出更加出色的 AI 應(yīng)用。

3

相關(guān)文章