中国黄色片毛,免费,亚洲欧美综合一区二区三区,一本色道久久综合亚洲精品不卡

亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁(yè) > 測(cè)評(píng) > 文章

2024-06-21 10:19

GPT-4o或?qū)⒈怀截瑿laude 3.5深夜發(fā)布，附最新體驗(yàn)分享

OpenAI的最大對(duì)手，Anthropic，沒(méi)有任何預(yù)兆的，官宣了自己的新模型。

Claude 3.5 Sonnet。

Claude3家族原本有三個(gè)參數(shù)量級(jí)的模型，分別是：

Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。

可以理解成Opus(大杯)、Sonnet(中杯)、Haiku(小杯)。

而這一次，是把中等參數(shù)模型Sonnet的3.5升級(jí)版放了出來(lái)。

在跑分上，除了MMLU(本科水平的知識(shí))和MATH(數(shù)學(xué)能力)上，基本都達(dá)到了最佳。

此處要注意，Claude 3.5 Sonnet只是一個(gè)中等參數(shù)模型，在參數(shù)量級(jí)上遠(yuǎn)遠(yuǎn)達(dá)不到Claude 3 Opus的級(jí)別，但是在跑分上超了，這就很恐怖。

而在多模態(tài)的視覺(jué)能力上也基本達(dá)到了全面領(lǐng)先。

除了視覺(jué)問(wèn)答(MMMU)離GPT4o還查了小1個(gè)點(diǎn)之外，其他的4項(xiàng)：視覺(jué)數(shù)學(xué)推理 (MathVista)、科學(xué)圖表理解 (AI2D)、圖表問(wèn)答、文檔視覺(jué)問(wèn)答 (ANLS)，都達(dá)到了最佳水平。

最搞的是，Anthropic在發(fā)布Claude 3.5 Sonnet前為了預(yù)熱，搞了一段小插曲，他們發(fā)了一段謎語(yǔ)。

我看了半天也沒(méi)看明白，然后朋友跟我說(shuō)，視頻里面的是摩斯密碼，轉(zhuǎn)換過(guò)來(lái)是Sonnet，上面的密碼要用維吉尼亞密碼去破，那一刻我才煥然大霧。

于是我扔給了GPT，GPT給我破譯了出來(lái)，得到了一段詩(shī)。

No more be grieved at that with which thou hast done - 不再因你所做的事情而感到悲傷。

Roses have thorns and silver fountains mud - 玫瑰有刺，銀色的泉水也有泥。

All models err yet between the third and fourth - 所有的模式都會(huì)出錯(cuò)，但在第三和第四之間。

Run our new creation blooms a wiser bud - 我們的新創(chuàng)造將綻放出一個(gè)更智慧的花蕾。

說(shuō)實(shí)話破完了又一次給我干懵逼了，這個(gè)謎語(yǔ)讓我感受到了我智商的低谷。。。

搜了半天，然后發(fā)現(xiàn)這段，原來(lái)是莎士比亞的第35首十四行詩(shī)，而十四行詩(shī)，其實(shí)對(duì)應(yīng)的單詞就是Sonnet。

那這下，答案就呼之欲出了，Anthropic要發(fā)Claude 3.5 Sonnet了。

就在我興致勃勃的準(zhǔn)備去炫耀我解出來(lái)謎題的時(shí)候，發(fā)現(xiàn)Anthropic已經(jīng)發(fā)公告正式官宣發(fā)布Claude 3.5 Sonnet 10分鐘了。。。

全世界都知道了，而且是在我花了好大力氣解完謎題之后，尼瑪，瞬間有一種被Anthropic背刺的感覺(jué)。

話說(shuō)回來(lái)，除了以中等參數(shù)實(shí)現(xiàn)了綜合跑分第一外，Claude 3.5 Sonnet的運(yùn)行速度是Claude 3 Opus的2倍，但是定價(jià)會(huì)更便宜，畢竟是中等參數(shù)的模型。

推理能力也確實(shí)有了提升，但是坦率的講，對(duì)于普通用戶來(lái)說(shuō)，可能直觀的差異性，不是很大。

最讓我驚喜的，其實(shí)是他們的新功能，Artifacts。

當(dāng)用戶要求 Claude 生成代碼片段、文本文件或網(wǎng)站設(shè)計(jì)等內(nèi)容時(shí)，右邊就會(huì)多出來(lái)一個(gè)實(shí)時(shí)的窗口，這個(gè)就是Artifacts。

這個(gè)功能需要手動(dòng)開(kāi)啟，點(diǎn)擊頭像，有個(gè)Feature Preview，點(diǎn)進(jìn)去，把Artifacts打開(kāi)就行。

比如說(shuō)，我想讓Claude幫我做一個(gè)橫版跳躍的小游戲，坤哥跳過(guò)各種障礙物的小游戲。

我在打開(kāi)Artifacts后，先讓claude給我畫一個(gè)主角，跟它說(shuō)：

給我畫一個(gè)8-bit的svg小人，灰色身體，白色頭發(fā)，旁邊有一個(gè)籃球。

他就會(huì)嘟嘟的寫代碼，這時(shí)候，右邊的Artifacts窗口就會(huì)被打開(kāi)。

所有代碼全部寫完后，他就會(huì)出來(lái)一個(gè)預(yù)覽和code的tab，此時(shí)，你就可以直接在Artifacts窗口里的預(yù)覽tab看到畫出來(lái)的svg小人了。

然后，我們?cè)谧宑laude幫忙畫一些裝飾的雞。

主角有了，雞有了，現(xiàn)在，我們讓claude幫忙做一個(gè)游戲，一個(gè)橫版的跳躍游戲，我們的主角坤哥需要不斷的跳過(guò)一只一只的小雞。

我直接說(shuō)：現(xiàn)在，請(qǐng)幫我做一個(gè)橫版的跳躍游戲，可操控的主角是8-bit的小人，需要跳過(guò)的障礙物是不斷迎面而來(lái)的一只一只不同的小雞，背景是藍(lán)色的天空。我每次按空格鍵就是跳躍。

很快，代碼就寫好了。

然后，我們?cè)陬A(yù)覽窗口，是真的，可以直接玩這個(gè)游戲的。

雖然把籃球給我干消失了，但是無(wú)傷大雅。

所以，Artifacts對(duì)于很多開(kāi)發(fā)者來(lái)說(shuō)，未來(lái)，是有巨大的效率提升的，直接以可視化的方式展現(xiàn)在你的面前，甚至，還是可以交互的。

可以預(yù)期到，未來(lái)例如網(wǎng)頁(yè)設(shè)計(jì)等等，會(huì)有巨大的效率提升。

甚至，你可以在Claude里，直接做一個(gè)PPT。

就非常的離譜。

相比于模型的更新，這種功能的更新，可能會(huì)實(shí)打?qū)嵉母屛遗d奮，它真的可以提升效率，以及整出不一樣的花活。

而ChatGPT雖然也有類似的交互，但是也只局限于一些數(shù)據(jù)分析場(chǎng)景。

Claude，這次，是做了大幅度的進(jìn)化。

最后，Anthropic說(shuō)，會(huì)在今年晚些時(shí)候，放出Claude 3.5 Haiku 和 Claude 3.5 Opus。

也在探索ChatGPT目前特有的記憶功能。

反正，這些模型廠商卷起來(lái)，對(duì)我們普通用戶來(lái)說(shuō)，肯定是好事。

只是老黃，可能要抱著他的英偉達(dá)，在那個(gè)鐵王座上，坐的更久一點(diǎn)了。

還有那個(gè)奧特曼。

你的GPT-5.到底啥時(shí)候端上來(lái)?

哦不對(duì)，先把你的完全版的GPT4o端上來(lái)再說(shuō)吧。

一個(gè)多月了，我還沒(méi)用上新語(yǔ)音和新視覺(jué)呢= =

呸，渣男。

查看相關(guān)話題： #claude 3.5 #Claude 3.5 Sonnet #GPT-4o

相關(guān)文章

數(shù)字生命卡茲克

原創(chuàng)作者

韭圈兒設(shè)計(jì)總監(jiān)，AIGC領(lǐng)域頭部KOL

作者已發(fā)布 64 篇文章

近期文章

OpenAI o1推理能力極限測(cè)試丨大模型的推理能力究竟有多脆弱？

Kimi最新更新，悄悄上線"探索版"，這下我真的想扔掉搜索引擎了。

巧妙利用這兩個(gè)AI產(chǎn)品，讓你的國(guó)慶出行沒(méi)有廢片

ChatGPT、阿里通義等AI機(jī)器人參加今年高考出分：干翻90%考生，有一科全員不及格

高考摸底大模型測(cè)評(píng)丨GPT-4o全面領(lǐng)先，國(guó)產(chǎn)大模型豆包文科成績(jī)優(yōu)勢(shì)明顯