ChatGPT AI搜索服務(wù)向用戶全面開放丨谷歌版SORA:Veo 2視頻生成模型發(fā)布丨月之暗面Kimi上線視覺思考模型k1
AI奇點網(wǎng)2024年12月17日報道丨AI資訊早報
當(dāng)?shù)貢r間12月16日,OpenAI 辦公室內(nèi)漫長的系列新品發(fā)布會繼續(xù)進行。在 OpenAI 的第八場發(fā)布會上 ,宣布向全球用戶免費開放旗下的 AI 搜素服務(wù) ChatGPT Search。
本次更新的主要亮點包括:
就在 11 月,外媒 The Information 披露,OpenAI 正在籌劃一款新產(chǎn)品,旨在將 AI 聊天機器人和網(wǎng)絡(luò)瀏覽器相結(jié)合,為旅游、餐飲和房地產(chǎn)等領(lǐng)域的網(wǎng)站提供搜索功能。
當(dāng)?shù)貢r間 12 月 16 日,谷歌旗下人工智能研究室 Deepmind 推出了全新升級的 AI 視頻模型 Veo 2 和圖像生成模型 Imagen 3。
根據(jù)官方博文發(fā)布的介紹,新一代的 Veo 2 帶來了多項重要突破:
此外,谷歌還針對 Imagen 3 圖像生成模型進行了全面升級,現(xiàn)在該模型的生成效果更加明亮、構(gòu)圖更精美,并支持更多樣化的藝術(shù)風(fēng)格,從寫實主義到印象派,從抽象風(fēng)格到動漫風(fēng)格,能夠涵蓋從寫實到抽象的多種風(fēng)格,生成更豐富的紋理。
12月16日,國內(nèi)AI大模型開發(fā)商月之暗面發(fā)布消息稱,旗下Kimi智能助手上線了一款視覺思考模型 k1。
官方介紹,這款 k1 視覺思考模型真正意義上實現(xiàn)了端到端的圖像理解和思考能力。
據(jù)介紹,在數(shù)學(xué)、物理、化學(xué)等基礎(chǔ)科學(xué)學(xué)科的基準(zhǔn)能力測試中,初代 k1 模型的表現(xiàn)超過了全球標(biāo)桿模型 OpenAI o1、GPT-4o以及 Claude 3.5 Sonnet。
k1 推理模型基于強化學(xué)習(xí)技術(shù)打造,原生支持端到端圖像理解和思維鏈技術(shù),并將能力擴展到數(shù)學(xué)之外的更多基礎(chǔ)科學(xué)領(lǐng)域。
新的 k1 視覺思考模型,借助端到端的圖像理解能力,解鎖了包括幾何圖形題在內(nèi)更加全面的數(shù)學(xué)能力。在不同階段的幾何和圖形題專項基準(zhǔn)能力測試中,k1-preview 成績追平或超過了 OpenAI 的 o1 模型。
該模型可以直接處理用戶輸入的圖像信息并進行思考得出答案,不需要借助外部的OCR或額外視覺模型進行信息處理,用戶體驗和效果都達到了新的高度。
近日,馬斯克旗下的人工智能研發(fā)公司 xAI 宣布,將面向所有的推特(X)平臺用戶免費推出目前最新商用運營版本的 Grok-2 大模型。
與以往一樣,Premium 和 Premium + 用戶將擁有更高級的功能使用,并能優(yōu)先訪問未來的任何新功能。
據(jù)官方介紹,Grok 聊天機器人可通過推特(X)平臺用戶每時每刻發(fā)送的數(shù)以萬計的數(shù)據(jù),來實時了解世界范圍內(nèi)正在發(fā)生的事情。
近期,Grok 還推出了兩個新功能:網(wǎng)頁 AI 搜索和數(shù)據(jù)來源引用,增強了 Grok 的使用體驗。
據(jù)彭博社報道,OpenAI 的首席財務(wù)官 Sarah Friar 近日對外表示,OpenAI 正在開發(fā)一款定價高達 2000 美元/月訂閱費用的會員制服務(wù),這跨產(chǎn)品可以達到「博士級的智能」,該產(chǎn)品可以作為人類職員的「替代品」。
Sarah Friar 表示,OpenAI 即將發(fā)布的這款產(chǎn)品是一款 AI Agent(AI 智能體產(chǎn)品),并且 Sarah Friar 認(rèn)為軟件可能會由此轉(zhuǎn)向基于價值的定價模型,通過訂閱這個 AI Agent 來讓 AI 自主完成一些復(fù)雜任務(wù),例如預(yù)定旅行,或者進行科研任務(wù)。