GPT-4o或?qū)⒈怀截瑿laude 3.5深夜發(fā)布,附最新體驗(yàn)分享
OpenAI的最大對(duì)手,Anthropic,沒(méi)有任何預(yù)兆的,官宣了自己的新模型。
Claude 3.5 Sonnet。
Claude3家族原本有三個(gè)參數(shù)量級(jí)的模型,分別是:
Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。
可以理解成Opus(大杯)、Sonnet(中杯)、Haiku(小杯)。
而這一次,是把中等參數(shù)模型Sonnet的3.5升級(jí)版放了出來(lái)。
在跑分上,除了MMLU(本科水平的知識(shí))和MATH(數(shù)學(xué)能力)上,基本都達(dá)到了最佳。
此處要注意,Claude 3.5 Sonnet只是一個(gè)中等參數(shù)模型,在參數(shù)量級(jí)上遠(yuǎn)遠(yuǎn)達(dá)不到Claude 3 Opus的級(jí)別,但是在跑分上超了,這就很恐怖。
而在多模態(tài)的視覺(jué)能力上也基本達(dá)到了全面領(lǐng)先。
除了視覺(jué)問(wèn)答(MMMU)離GPT4o還查了小1個(gè)點(diǎn)之外,其他的4項(xiàng):視覺(jué)數(shù)學(xué)推理 (MathVista)、科學(xué)圖表理解 (AI2D)、圖表問(wèn)答、文檔視覺(jué)問(wèn)答 (ANLS),都達(dá)到了最佳水平。
最搞的是,Anthropic在發(fā)布Claude 3.5 Sonnet前為了預(yù)熱,搞了一段小插曲,他們發(fā)了一段謎語(yǔ)。
我看了半天也沒(méi)看明白,然后朋友跟我說(shuō),視頻里面的是摩斯密碼,轉(zhuǎn)換過(guò)來(lái)是Sonnet,上面的密碼要用維吉尼亞密碼去破,那一刻我才煥然大霧。
于是我扔給了GPT,GPT給我破譯了出來(lái),得到了一段詩(shī)。
No more be grieved at that with which thou hast done - 不再因你所做的事情而感到悲傷。
Roses have thorns and silver fountains mud - 玫瑰有刺,銀色的泉水也有泥。
All models err yet between the third and fourth - 所有的模式都會(huì)出錯(cuò),但在第三和第四之間。
Run our new creation blooms a wiser bud - 我們的新創(chuàng)造將綻放出一個(gè)更智慧的花蕾。
說(shuō)實(shí)話破完了又一次給我干懵逼了,這個(gè)謎語(yǔ)讓我感受到了我智商的低谷。。。
搜了半天,然后發(fā)現(xiàn)這段,原來(lái)是莎士比亞的第35首十四行詩(shī),而十四行詩(shī),其實(shí)對(duì)應(yīng)的單詞就是Sonnet。
那這下,答案就呼之欲出了,Anthropic要發(fā)Claude 3.5 Sonnet了。
就在我興致勃勃的準(zhǔn)備去炫耀我解出來(lái)謎題的時(shí)候,發(fā)現(xiàn)Anthropic已經(jīng)發(fā)公告正式官宣發(fā)布Claude 3.5 Sonnet 10分鐘了。。。
全世界都知道了,而且是在我花了好大力氣解完謎題之后,尼瑪,瞬間有一種被Anthropic背刺的感覺(jué)。
話說(shuō)回來(lái),除了以中等參數(shù)實(shí)現(xiàn)了綜合跑分第一外,Claude 3.5 Sonnet的運(yùn)行速度是Claude 3 Opus的2倍,但是定價(jià)會(huì)更便宜,畢竟是中等參數(shù)的模型。
推理能力也確實(shí)有了提升,但是坦率的講,對(duì)于普通用戶來(lái)說(shuō),可能直觀的差異性,不是很大。
最讓我驚喜的,其實(shí)是他們的新功能,Artifacts。
當(dāng)用戶要求 Claude 生成代碼片段、文本文件或網(wǎng)站設(shè)計(jì)等內(nèi)容時(shí),右邊就會(huì)多出來(lái)一個(gè)實(shí)時(shí)的窗口,這個(gè)就是Artifacts。
這個(gè)功能需要手動(dòng)開(kāi)啟,點(diǎn)擊頭像,有個(gè)Feature Preview,點(diǎn)進(jìn)去,把Artifacts打開(kāi)就行。
比如說(shuō),我想讓Claude幫我做一個(gè)橫版跳躍的小游戲,坤哥跳過(guò)各種障礙物的小游戲。
我在打開(kāi)Artifacts后,先讓claude給我畫一個(gè)主角,跟它說(shuō):
給我畫一個(gè)8-bit的svg小人,灰色身體,白色頭發(fā),旁邊有一個(gè)籃球。
他就會(huì)嘟嘟的寫代碼,這時(shí)候,右邊的Artifacts窗口就會(huì)被打開(kāi)。
所有代碼全部寫完后,他就會(huì)出來(lái)一個(gè)預(yù)覽和code的tab,此時(shí),你就可以直接在Artifacts窗口里的預(yù)覽tab看到畫出來(lái)的svg小人了。
然后,我們?cè)谧宑laude幫忙畫一些裝飾的雞。
主角有了,雞有了,現(xiàn)在,我們讓claude幫忙做一個(gè)游戲,一個(gè)橫版的跳躍游戲,我們的主角坤哥需要不斷的跳過(guò)一只一只的小雞。
我直接說(shuō):現(xiàn)在,請(qǐng)幫我做一個(gè)橫版的跳躍游戲,可操控的主角是8-bit的小人,需要跳過(guò)的障礙物是不斷迎面而來(lái)的一只一只不同的小雞,背景是藍(lán)色的天空。我每次按空格鍵就是跳躍。
很快,代碼就寫好了。
然后,我們?cè)陬A(yù)覽窗口,是真的,可以直接玩這個(gè)游戲的。
雖然把籃球給我干消失了,但是無(wú)傷大雅。
所以,Artifacts對(duì)于很多開(kāi)發(fā)者來(lái)說(shuō),未來(lái),是有巨大的效率提升的,直接以可視化的方式展現(xiàn)在你的面前,甚至,還是可以交互的。
可以預(yù)期到,未來(lái)例如網(wǎng)頁(yè)設(shè)計(jì)等等,會(huì)有巨大的效率提升。
甚至,你可以在Claude里,直接做一個(gè)PPT。
就非常的離譜。
相比于模型的更新,這種功能的更新,可能會(huì)實(shí)打?qū)嵉母屛遗d奮,它真的可以提升效率,以及整出不一樣的花活。
而ChatGPT雖然也有類似的交互,但是也只局限于一些數(shù)據(jù)分析場(chǎng)景。
Claude,這次,是做了大幅度的進(jìn)化。
最后,Anthropic說(shuō),會(huì)在今年晚些時(shí)候,放出Claude 3.5 Haiku 和 Claude 3.5 Opus。
也在探索ChatGPT目前特有的記憶功能。
反正,這些模型廠商卷起來(lái),對(duì)我們普通用戶來(lái)說(shuō),肯定是好事。
只是老黃,可能要抱著他的英偉達(dá),在那個(gè)鐵王座上,坐的更久一點(diǎn)了。
還有那個(gè)奧特曼。
你的GPT-5.到底啥時(shí)候端上來(lái)?
哦不對(duì),先把你的完全版的GPT4o端上來(lái)再說(shuō)吧。
一個(gè)多月了,我還沒(méi)用上新語(yǔ)音和新視覺(jué)呢= =
呸,渣男。
近期文章
更多