蘋果與OpenAI就AI功能合作恢復(fù)談判丨清華團隊打造國產(chǎn)「Sora」丨阿里開源1100億參數(shù)Qwen1.5-110B
AI奇點網(wǎng)2024年4月28日報道丨AI資訊早報
據(jù)華爾街日報當(dāng)?shù)貢r間4月26日報道,據(jù)知情人士指出,蘋果公司就AI合作項目重啟與OpenAI談判。雙方計劃醞釀在今年秋季推出的新一代iPhone產(chǎn)品中使用后者的技術(shù)。兩家公司正在探討整合OpenAI技術(shù)到iOS 18/新一代macOS系統(tǒng)的可能性。
除此之外,蘋果也在與谷歌、百度及其他AI公司討論合作的機會,該公司CEO庫克承諾今年蘋果將在AI領(lǐng)域?qū)崿F(xiàn)突破,如何將生成式AI引入iOS 18平臺將是關(guān)鍵途徑,此外手機端AI個人助理Siri也將獲得改進。
生數(shù)科技和清華大學(xué)聯(lián)合發(fā)布了新的AI視頻生成模型“Vidu”,該模型可以一鍵生成長達16秒、分辨率達1080p的高清視頻內(nèi)容。“Vidu”在多鏡頭語言、時間和空間一致性、遵循物理規(guī)律等方面表現(xiàn)出色,能夠產(chǎn)生非常逼真的超現(xiàn)實主義畫面。
同時,“Vidu”還具有豐富的想象力,能生成現(xiàn)實世界中不存在的畫面,為創(chuàng)作超現(xiàn)實主義內(nèi)容提供了新的可能。全新技術(shù)突破僅用了兩個月時間,迅速實現(xiàn)。
近日,一款A(yù)I圖像生成模型的論文走紅。該大模型由韓國科學(xué)技術(shù)院(KAIST)、OMNIOUS.AI共同打造,他們提出了一種名為「IDM-VTON」的新型擴散模型,該技術(shù)在提高服裝保真度的同時,還能生成真實的視覺效果。
讓 AI 系統(tǒng)幫顧客試穿衣服,想穿什么款式直接一鍵搞定。精準(zhǔn)捕捉服裝細(xì)節(jié),衣服紋理、圖案、縫線等屬性高度還原:
即使是在戶外,AI 試衣也能準(zhǔn)確展示試穿效果,保持較高質(zhì)量的輸出:
人物坐立姿勢對衣物有遮擋,AI 也會毫無破綻的實現(xiàn)一鍵換衣,高度保持服裝細(xì)節(jié)的一致性:
4月22日,科大訊飛在上周六的股票交易市場互動平臺透露,該公司計劃在 5 月推出一款 AI 大模型的智能硬件產(chǎn)品,這款產(chǎn)品是一種基于大模型開發(fā)的「智能臺歷」。將會在京東、天貓等電商平臺上新搭載星火大模型的語音臺歷,具備更廣泛的知識覆蓋、更強的理解能力及更自然的人機交互。
這款語音臺歷產(chǎn)品的詳細(xì)配置、規(guī)格信息,官方?jīng)]有過多透露。根據(jù)外接推測,這跨產(chǎn)品可能類似于目前市面上的智能音箱產(chǎn)品,它更突出辦公場景的需求,在日歷臺歷與提醒事項日程、AI個人助理等方面,提供更多的智能化解決方案。
4 月 27 日消息,阿里巴巴日前宣布,開源 Qwen1.5 系列首個千億參數(shù)模型 Qwen1.5-110B,該模型在基礎(chǔ)能力評估中與 Meta-Llama3-70B 相媲美,在 Chat 評估中表現(xiàn)出色,包括 MT-Bench 和 AlpacaEval 2.0。
據(jù)介紹,Qwen1.5-110B 與其他 Qwen1.5 模型相似,采用了相同的 Transformer 解碼器架構(gòu)。它包含了分組查詢注意力(GQA),在模型推理時更加高效。該模型支持 32K tokens 的上下文長度,同時它仍然是多語言的,支持英、中、法、西、德、俄、日、韓、越、阿等多種語言。
阿里 Qwen1.5-110B 模型與最近的 SOTA 語言模型 Meta-Llama3-70B 以及 Mixtral-8x22B 進行了比較,結(jié)果如下:
上述結(jié)果顯示,新的 110B 模型在基礎(chǔ)能力方面至少與 Llama-3-70B 模型相媲美。在這個模型中,阿里巴巴沒有對預(yù)訓(xùn)練的方法進行大幅改變,因此他們認(rèn)為與 72B 相比的性能提升主要來自于增加模型規(guī)模。
蘋果、谷歌的手機應(yīng)用商店近日下架了多款標(biāo)榜可以實現(xiàn)“一鍵去衣”的AI應(yīng)用,此類惡意AI軟件廣告曾在Meta旗下社交媒體平臺上投放。Meta應(yīng)對此問題采取了廣告下架等措施,美國學(xué)生因使用相關(guān)軟件而被逮捕。美國參議院提出《打擊非法偽造圖像法案》應(yīng)對此類行為。