OpenAI o1大模型API年度大促銷丨谷歌發(fā)布AI圖像生成新工具Whisk支持多圖融合丨智譜AI新增30億元融資
AI奇點(diǎn)網(wǎng)2024年12月18日?qǐng)?bào)道丨AI資訊早報(bào)
當(dāng)?shù)貢r(shí)間12月17日,OpenAI舉行年底的連續(xù)第九場(chǎng)發(fā)布活動(dòng),其焦點(diǎn)主要放在 API 和開(kāi)發(fā)者服務(wù)的全新升級(jí)上,并宣布向 API 使用等級(jí)“第五級(jí)”的開(kāi)發(fā)者開(kāi)放 OpenAI o1 API 的訪問(wèn)權(quán)限。
其中,o1 模型的 API 與之前的預(yù)覽版本相比,思考成本降低了 60%,并且附帶高級(jí)視覺(jué)功能;GPT-4o 的音頻成本降低 60%,而 o1 mini 版本價(jià)格更是暴降了 10 倍。
據(jù)官方介紹,現(xiàn)已正式上線的 o1 具備多項(xiàng)關(guān)鍵功能,可支持實(shí)際應(yīng)用場(chǎng)景如下:
據(jù)悉,首批能夠使用 o1 API 的開(kāi)發(fā)者為 OpenAI 的“第五級(jí)”用戶。要達(dá)到該級(jí)別,開(kāi)發(fā)者需要在 OpenAI 平臺(tái)上累計(jì)消費(fèi)至少 1000 美元,并且自首次成功付款以來(lái)賬戶已超過(guò) 30 天。正式版的 o1 API 取代了此前 API 中此前提供的 o1-preview 模型 API。
當(dāng)?shù)貢r(shí)間 12 月 16 日,谷歌今日發(fā)布了一款名為「Whisk」的全新 AI 圖像生成工具,該工具允許用戶使用其他圖像作為提示來(lái)生成圖像,而不需要冗長(zhǎng)的文本提示。用戶只需提供圖像,即可指定 AI 生成圖像的主題、場(chǎng)景和風(fēng)格。
使用「Whisk」時(shí),用戶可以為主題、場(chǎng)景和風(fēng)格分別提供多張圖像作為提示。如果手頭沒(méi)有合適的圖像,用戶還可以點(diǎn)擊骰子圖標(biāo),由谷歌 AI 隨機(jī)生成一些填充的圖像作為提示圖。此外,用戶還可以在流程的最后階段在文本框中輸入一些文字,以添加關(guān)于目標(biāo)圖像的額外細(xì)節(jié),但這并非必需步驟。
「Whisk」隨后會(huì)生成圖像,并為每張圖像生成相應(yīng)的文本提示。如果用戶對(duì)生成結(jié)果滿意,可以選擇收藏或下載圖像;如果需要進(jìn)一步調(diào)整,則可以通過(guò)在文本框中輸入更多文字或點(diǎn)擊圖像并編輯文本提示來(lái)進(jìn)行優(yōu)化。
谷歌在一篇博文中強(qiáng)調(diào),「Whisk」的設(shè)計(jì)初衷是“快速的視覺(jué)探索,而非像素級(jí)的精準(zhǔn)編輯圖像”。該公司還表示,「Whisk」可能會(huì)出現(xiàn)“偏差”,因此允許用戶編輯底層的提示詞或圖。
當(dāng)?shù)貢r(shí)間12月17日,OpenAI 官方對(duì)外透露,目前暫時(shí)沒(méi)有推出其視頻生成模型 Sora 的應(yīng)用程序接口 API 的計(jì)劃。該公司在上周對(duì)外正式發(fā)布了這款全球矚目的視頻生成模型,但僅僅只能通過(guò)官網(wǎng)進(jìn)行有限度的訪問(wèn)與使用。
在 OpenAI 開(kāi)發(fā)團(tuán)隊(duì)成員的在線問(wèn)答活動(dòng)中,OpenAI 開(kāi)發(fā)者體驗(yàn)負(fù)責(zé)人 Romain Huet 明確指出:“我們目前還沒(méi)有推出 Sora API 的計(jì)劃。”
在 SORA 大模型正式推出的那天,由于訪問(wèn)量短期內(nèi)突然激增,遠(yuǎn)超評(píng)估的預(yù)期,OpenAI 此前不得不緊急關(guān)閉了 SORA 注冊(cè)賬號(hào)的申請(qǐng)通道。OpenAI CEO 奧特曼為此還在 X 平臺(tái)上進(jìn)行公開(kāi)道歉,承認(rèn)“嚴(yán)重低估了對(duì) SORA 的需求”,并表示需要一段時(shí)間才能讓所有人都能使用,正在努力尋找盡快實(shí)現(xiàn)的方法。
OpenAI 暫緩?fù)瞥?Sora API,使其與主要競(jìng)爭(zhēng)對(duì)手的角逐中處于不利地位。最大競(jìng)爭(zhēng)對(duì)手之一的谷歌已于 12 月初推出了其視頻生成模型 Veo 的有限訪問(wèn) API 權(quán)限。官方透露,后續(xù)還將對(duì)用戶開(kāi)放剛剛發(fā)布上線的 Veo 2 視頻生成模型的 API。
據(jù) APPSO 消息,國(guó)內(nèi)人工智能創(chuàng)業(yè)公司智譜 AI 近期完成了新一輪的 30 億人民幣融資,本輪融資的新投資方包括多家戰(zhàn)投及國(guó)資,老股東君聯(lián)資本等繼續(xù)跟投。這是智譜 AI 近期可查的第二輪公開(kāi)的融資。
據(jù)悉,本輪融資將用于智譜 GLM 大模型系列的研發(fā)工作,旨在從簡(jiǎn)單的問(wèn)題回答擴(kuò)展到解決更復(fù)雜的推理和多模態(tài)任務(wù),以更好地服務(wù)于行業(yè)生態(tài)的發(fā)展。
2024 年,智譜 AI 業(yè)務(wù)保持高速增長(zhǎng)態(tài)勢(shì),與去年相比,智譜 AI 取得的商業(yè)化收益增長(zhǎng)超過(guò) 100%。
智譜 AI 是目前國(guó)內(nèi)估值最高的大模型開(kāi)發(fā)商,估值超過(guò) 200 億元。智譜 AI 開(kāi)源的 ChatGLM 等 50 余款大模型在全球范圍的累計(jì)下載量超過(guò) 3000 萬(wàn),獲得超過(guò) 15 萬(wàn)顆 GitHub 社區(qū)的“星標(biāo)”關(guān)注。智譜 AI 也因此成為了國(guó)內(nèi)大模型領(lǐng)域“星標(biāo)”數(shù)最多的企業(yè)。
智譜 AI 還是國(guó)內(nèi)唯一入選「TechCrunch」評(píng)選的全球 15 家新晉 AI 獨(dú)角獸 Unicorn Board 榜單的企業(yè)。公司還入選了福布斯中國(guó)創(chuàng)新力企業(yè) 50 強(qiáng)和 Hugging Face 平臺(tái)最受歡迎人工智能機(jī)構(gòu)。
當(dāng)?shù)貢r(shí)間12月14日,據(jù) TechCrunch 報(bào)道,OpenAI 聯(lián)合創(chuàng)始人兼前任首席科學(xué)家 Ilya Sutskever 通過(guò)全球一年一度的 AI 技術(shù)大會(huì) NeurIPS 上發(fā)表演講展望了所謂的「超智能 AI」(Superintelligent AI)的未來(lái)模樣。
他認(rèn)為,這種 AI 系統(tǒng)在許多領(lǐng)域的表現(xiàn)將超越絕大多數(shù)的人類,他相信這一事實(shí)終將兌現(xiàn)。他指出,「超級(jí)智能 AI」將從質(zhì)上與與我們現(xiàn)存的 AI 大模型完全不同,某些擬真的方面甚至讓人難以辨認(rèn)人機(jī)的差異性。
他表示,「超智能 AI」系統(tǒng)將真正具備 AI 智能體的特性,而非當(dāng)前我們所說(shuō)的“僅有微弱的代理特征”的 AI 系統(tǒng)。它們將具備很強(qiáng)的推理能力,因此變得更加難以預(yù)測(cè)行為方式。它們能夠從有限的數(shù)據(jù)中理解復(fù)雜的事物,且將具備自我意識(shí)。
他還提到,這些 AI 系統(tǒng)甚至可能會(huì)向人類索求享有某種權(quán)利。