亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁  >  資訊  >  文章
2024-08-30 09:05

智譜AI發(fā)布新一代GLM-4系列基礎大模型丨外媒曝:蘋果英偉達微軟聯(lián)合投資OpenAI丨阿里發(fā)布通義視覺模型Qwen2-VL

AI奇點網(wǎng)2024年8月30日報道丨AI資訊早報

智譜AI發(fā)布新一代基礎大模型,向C端全面放開視頻通話服務

8月29日,國內(nèi)人工智能獨角獸智譜 AI 在 KDD 2024 大會上發(fā)布了新一代基礎模型,基礎模型版本基于當前的 GLM-4。

自稱在相應領域均達到了國際第一梯隊的水準,并宣布在 MaaS 平臺上免費開放 GLM-4-Flash API:

  • 語言模型 GLM-4-Plus:在語言理解、指令遵循、長文本處理等方面性能得到全面提升。
  • 文生圖模型 CogView-3-Plus:具備與當前最上面的 MJ-V6 和 FLUX 等模型接近的性能。
  • 圖像 / 視頻理解模型 GLM-4V-Plus:具備卓越的圖像理解能力,并具備基于時間采集的視頻理解能力。該模型將上線開放平臺(bigmodel.cn),并成為國內(nèi)首個通用視頻理解能力模型 API。
  • 視頻生成模型 CogVideoX:在發(fā)布并開源 2B 版本后,5B 版本也正式開源,其性能進一步增強。
  • GLM-4-Flash API:推理服務免費,并提供完全強大的服務。

除此之外,智譜 AI 還宣布在旗下的智譜清言 App 上線了視頻通話功能,這是國內(nèi)首個面向 C 端用戶開放的視頻通話服務。

智譜 AI 還表示,GLM-4-Plus 基礎模型在各項指標上,實現(xiàn)與 OpenAI 的 GPT-4o 等頭部大模型第一梯隊水平相持平。

此外,在 GLM-4-Plus 模型的訓練過程中,智譜 AI 通過采用更精準的長短文本數(shù)據(jù)混合策略,顯著增強了模型在長文本推理方面的表現(xiàn)。

外媒曝:蘋果英偉達微軟聯(lián)合投資OpenAI

據(jù)外媒援引知情人士消息,蘋果、英偉達、微軟已洽談加入OpenAI的新一輪融資,融資額將達到數(shù)十億美元。這將使OpenAI的估值創(chuàng)紀錄地突破1000億美元的大關,成為僅次于字節(jié)跳動的全球第二大獨角獸。

本輪融資由風投公司Thrive Capital領投。Thrive Capital將投資約10億美元。據(jù)彭博社援引知情人士消息,英偉達已討論投資約1億美元。

目前尚不清楚蘋果、微軟將在本輪向OpenAI投資多少。

如果談判進展順利,這將意味著,全球市值最高的三家科技公司——蘋果、英偉達、微軟——都將成為OpenAI的投資方。

OpenAI官宣:ChatGPT全球周活躍用戶人數(shù)破2億

當?shù)貢r間8月29日,來自科技媒體 Axios 的報道稱,報道稱 OpenAI 的 AI 聊天機器人 ChatGPT 目前周活躍用戶數(shù)量已經(jīng)超過 2 億,短短一年的時間實現(xiàn)數(shù)量級的翻倍。

OpenAI 還表示,在全球財富 500 強的企業(yè)中,92% 正在使用本公司的產(chǎn)品。自 7 月份發(fā)布 GPT-4o mini 小參數(shù)模型以來,其自動 API 的使用量已翻了一番。

阿里通義發(fā)布視覺模型Qwen2-VL:處理任意分辨率圖像無需分割成塊

8月29日,阿里云通義千問團隊發(fā)布了新一代的圖像視覺識別大模型 Qwen-VL,推出 Qwen2-VL 版本。

Qwen2-VL 的一項關鍵架構改進是實現(xiàn)了動態(tài)分辨率支持(Naive Dynamic Resolution support)。

與上一代模型 Qwen-VL 不同,Qwen2-VL 可以處理任意分辨率的圖像,而無需將其分割成塊,從而確保模型輸入與圖像固有信息之間的一致性。這種方法更接近地模仿人類的視覺感知,使模型能夠處理任何清晰度或大小的圖像。

另一個關鍵架構增強是 Multimodal Rotary Position Embedding(M-ROPE)。通過將 original rotary embedding 分解為代表時間和空間(高度和寬度)信息的三個部分,M-ROPE 使 LLM 能夠同時捕獲和集成 1D 文本、2D 視覺和 3D 視頻位置信息。這使 LLM 能夠充當多模態(tài)處理器和推理器。

在 7B 規(guī)模下,Qwen2-VL-7B 保留了對圖像、多圖像和視頻輸入的支持,以更具成本效益的模型大小提供“具有競爭力”的性能。

Qwen2-VL-2B 模型針對潛在的移動部署進行了優(yōu)化。盡管參數(shù)量只有 2B,但官方表示該模型在圖像、視頻和多語言理解方面表現(xiàn)出色。

阿里云聯(lián)合中科院發(fā)布國際首個「月球專業(yè)大模型」

8月29日,中國科學院地球化學研究社發(fā)布消息稱,已經(jīng)與阿里云聯(lián)合打造了國際上首個「月球科學多模態(tài)專業(yè)大模型」。

圖片

據(jù)介紹,這個大模型基于阿里云通義系列構建,目前在月球撞擊坑年代和形態(tài)判別上,準確率已達到 80% 以上。

據(jù)統(tǒng)計,目前月球上直徑一公里以上的月球撞擊坑數(shù)量已超 100 萬個,直徑一公里以下的撞擊坑數(shù)量至今無法確定。如果完全依賴人工,完成所有月球撞擊坑的識別是 「幾乎無法實現(xiàn)的」。而月球專業(yè)大模型的應用則極大提高了科研效率。

AI繪圖平臺Midjourney宣布進軍硬件領域

當?shù)貢r間8月29日,AI 圖像生成平臺 Midjourney 宣布,即將進軍硬件終端設備的制造領域。

圖片

據(jù)官方介紹,其全新設立的硬件研發(fā)團隊將部署在舊金山。今年 2 月,Midjourney 聘請了 Ahmad Abbas,他此前是馬斯克旗下腦機開發(fā)機構 Nerualink 的員工,也曾經(jīng)幫助蘋果設計 Vision Pro 頭顯設備。

目前,Midjourney 還沒有透露會打造何種硬件。Midjourney 的 CEO 曾經(jīng)創(chuàng)立了一家生產(chǎn)運動識別設備的公司 Leap Motion。

3
查看相關話題: