亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁  >  資訊  >  文章
2024-10-23 08:38

Anthropic發(fā)布Claude 3.5系列,AI可代理控制電腦丨Stable Diffusion 3.5發(fā)布丨微軟正與OpenAI洽談140億美元股權投資方案

AI奇點網2024年10月23日報道丨AI資訊早報

Anthropic發(fā)布Claude 3.5系列,還可以模擬人類控制電腦操作

當?shù)貢r間10月22日,國際知名的大語言模型開發(fā)商Anthropic發(fā)布了Claude 3.5 Sonnet升級版,以及新一代模型Claude 3.5 Haiku。

Claude 3.5 Haiku在V3.0基礎上進行了大幅度更新,在相同成本的情況下推理效率、性能得到顯著增強。即便與上一代的最大模型Claude 3 Opus相比,Claude 3.5 Haiku在許多智能基準測試中都表現(xiàn)出了超越的態(tài)勢。

在編碼任務方面,Claude 3.5 Haiku特別強,在 SWE-bench Verified 上得分達到了 40.6%,超越了許多使用公開可用的最先進模型的模型,包括原始的 Claude 3.5 Sonnet 和 GPT-4o。

在本次新版本的發(fā)布同時,Anthropic還宣布推出了一項革命性的功能——「Computer use」。通過 API 開發(fā)者可以讓 Claude 像人類一樣使用計算機控制鼠標、鍵盤,包括查看屏幕、移動光標、點擊按鈕和輸入文本等操作,在開發(fā)者的圈子內一時驚起千層浪。

例如,用戶可以讓 Claude 代理執(zhí)行搜索網頁上的信息、在電子表格中填寫數(shù)據(jù);打開軟件進行特定的操作;協(xié)助開發(fā)人員執(zhí)行重復性任務、測試代碼等,整個流程 Claude 都會根據(jù)指令自動執(zhí)行相應的操作。

目前,「Computer use」主要依靠API來驅動自動化指令,當開發(fā)者通過API向Claude 發(fā)送指令時,Claude會運用其自然語言處理能力解析指令。其內部語言模型會對指令文本進行詞法、句法和語義分析,將指令意圖映射到對應的經典計算機操作概念上,預訓練的知識包括常見的計算機操作術語、軟件功能描述等,以便讓大模型可以準確執(zhí)行特定的操作,計算產業(yè)將迎來一個全新的自動化時代。

Stability AI開源新一代文生圖模型Stable Diffusion 3.5

當?shù)貢r間10月22日,知名開源圖像生成器Stable Diffusion開發(fā)商Stability AI宣布推出全新的V3.5版本。

Stable Diffusion 3.5一共有Large、Large Turbo和Medium三個版本,可根據(jù)不同的商業(yè)環(huán)境提供高度定制功能,同時對這些模型進行了大幅度優(yōu)化可在消費級GPU就能輕松推理運行。

Stable Diffusion 3.5提供了多個版本的圖像大模型,以滿足不同用戶群體的需求。

  • Stable Diffusion 3.5 Large模型擁有80億參數(shù),提供了卓越的圖片質量和高度文本語義還原,是Stable Diffusion家族中最強大的模型,非常適合專業(yè)使用,尤其是在100萬像素分辨率的圖片。
  • Stable Diffusion 3.5 Large Turbo模型則是一個蒸餾版本,它能夠在僅僅4步之內生成高質量的圖像,并且對提示的遵循性非常好,速度比Stable Diffusion 3.5 Large快得多。
  • Stable Diffusion 3.5 Medium模型將在10月29日發(fā)布,這個模型有25億參數(shù),采用了改進的MMDiT-X架構和訓練方法,能在消費級硬件上即開即用,可生成0.25—200萬像素之間生成圖像,兼顧了質量和易定制性。

今年6月,Stability AI首次開源了第三代文生圖模型Stable Diffusion 3 Medium,但在用戶群里反饋效果未達到預期,在聽取了社區(qū)反饋后,Stability AI花費大量時間進一步開發(fā),便有了今天推出的V3.5版本。

微軟正與OpenAI洽談價值140億美元的股權投資方案

當?shù)貢r間10月20日,來自華爾街日報的獨家消息,微軟正與OpenAI進行140億美元的投資股權談判。

除了股權之外,微軟作為目前OpenAI的最大股東與資金支持方,其轉型為「營利性企業(yè)」之后,在未來的公司治理、發(fā)展方面具備多少的實際控制權也是談判的重點。

OpenAI在近期取得了來自Thrive Capital、英偉達、微軟、軟銀等科技巨頭的66億美元巨額投資,這些投資機構要求OpenAI在兩年內需要轉型成為一家正常的營利公司,不然就會要求OpenAI償還所有的投資。雖然OpenAI今年的預期營收將會超過30億美元,但其收入主要用于償還投資者。

商湯CEO發(fā)布“三位一體”AI新戰(zhàn)略,強化應用落地

10 月 22 日上午,據(jù)新浪科技報道,商湯科技即將迎來公司成立十周年之際,董事長兼CEO徐立在近日發(fā)布了公司的內部信,首次提及公司決策層最新確立的「大裝置-大模型-應用」的”三位一體“AI新戰(zhàn)略,同時宣布將圍繞戰(zhàn)略和核心資源,構建更加集中和高效的組織架構,加快組織和管理的輕盈化進程。

在報道中寫道,徐立發(fā)布的內部信闡述了自己對于過去傳統(tǒng)的 AI 1.0 時代以及今天的生成式大模型 AI 2.0 時代的不同差異的理解。

他指出,“AI 1.0 被看作是專用智能,專注于單任務和信息處理;而 AI 2.0 被視為通用智能,強調多任務和內容生成。”

在他看來,這樣的描述雖然簡單易懂,卻并非完全準確,因為”通用“與”專用“之間并無明確界限,而且 AI 的落地應用終究要場景化,比如生成式大模型在垂直領域的應用。

Midjourney官網下周上線AI圖像編輯功能

當?shù)貢r間10月21日消息,Midjourney CEO David Holz 在 Discord 平臺發(fā)布消息稱,將于下周為 Midjourney 的用戶帶來一款全新的 AI 圖像編輯器工具,這款工具將內潛在官網的圖像生成工具內。

在新上線的官網內,注冊用戶在上傳圖像后,可針對圖像進行AI修圖,包括放大、縮小、調整角度等多種操作,這些操作都無需再經由 Discord 平臺就可以完成了,只需直接使用簡單命令即可完成;用戶可以使用數(shù)字畫筆進行修補,進行更精細的修改。

此外該 AI 圖像編輯器還可以基于上傳圖像的深度信息生成新圖片,保留原始構圖和內容不變的情況下,徹底改變紋理、顏色和細節(jié)。

Kakao推出AI助理服務:總結群聊、記錄日程等

10 月 22 日消息,據(jù)韓聯(lián)社報道,韓國知名的即時通信應用巨頭 Kakao 宣布推出名為「Kanana」的 AI 人工智能助理服務,作為一款內置在 Kakao 聊天軟件內的 AI 機器人,將提供一些實用性的生成式 AI 功能。

Kakao CEO 鄭新雅介紹稱,「Kanana」不僅僅是一款經典的 AI 助理功能,它的定位其實是“AI伴侶”,能夠在對話中記住關鍵信息,并根據(jù)上下文為用戶提供回應。其具備理解群組對話的能力,并能提供相應的智能回應。

據(jù)悉,「Kanana」分為兩個部分:作為群聊 AI 助手的 Kana 和作為個人 AI 伴侶的 Nana。

Nana 能記住用戶的個人對話和群組對話內容,如幫助用戶記住在群組討論中的會議日程或提醒準備事項、總結群聊的要點,支持文字 / 語音互動,同時也可理解各種格式的文檔,并生成摘要。

Kana 主要負責記住群聊內容,幫助用戶解決實際問題,如可以在學習群里發(fā)布測驗,并提供評分、解答,或者在情侶之間的對話中建議約會計劃。

此外,「Kanana」還將推出車載模式,用戶可以在智能汽車的車機上通過語音方式與 AI 實現(xiàn)互動。

7

相關文章