亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁 > 資訊 > 文章

2024-07-19 10:48

「青春版」GPT-4o mini零元砸場(chǎng)：OpenAI發(fā)布性比價(jià)最高的大模型，GPT-3.5功成身退

AI奇點(diǎn)網(wǎng)7月19日?qǐng)?bào)道丨今天一早，ChatGPT再度上新。

當(dāng)?shù)貢r(shí)間7月18日，OpenAI發(fā)布一款「GPT-4o mini」的新模型——是目前旗下最強(qiáng)的GPT-4o的小參數(shù)量簡(jiǎn)化版，用中國(guó)人的話講便是「青春版」，而且是完全免費(fèi)的。?

從OpenAI分享的基準(zhǔn)測(cè)評(píng)結(jié)果來看，GPT-4o mini在推理能力上超越了谷歌Gemini Flash和Anthropic Claude 3 Haiku等競(jìng)爭(zhēng)對(duì)手的“中杯”版本。

GPT-4o mini 在數(shù)學(xué)推理和編程任務(wù)方面也同樣表現(xiàn)出色，遠(yuǎn)超市場(chǎng)上的其他小型模型。

在 MGSM 數(shù)學(xué)推理能力基準(zhǔn)測(cè)試中，GPT-4o mini 得分達(dá)到了 87.0%，而 Gemini Flash 的得分為 75.5%，Claude Haiku 的得分為 71.7%。

GPT-4o mini 在 HumanEval 基準(zhǔn)測(cè)試中同樣再次展現(xiàn)優(yōu)勢(shì)，得分達(dá)到 87.2%，而 Gemini Flash 的得分為 71.5%，Claude Haiku 的得分為 75.9%。

圖片

而在多模態(tài)推理 MMMU 中，GPT-4o mini 也表現(xiàn)出色，得分為 59.4%，而 Gemini Flash 得分為 56.1%，Claude Haiku 得分為 50.2%。

值得注意的是，作為上一代的大模型，GPT-3.5 Turbo 在這些基準(zhǔn)測(cè)試中的得分均不如 GPT-4o mini。OpenAI表示，GPT-4o mini是「目前功能最強(qiáng)大、性價(jià)比最高的小參數(shù)模型」，這款新模型支持50種語言，將替代陳舊的GPT-3.5。

GPT-4o mini支持128K長(zhǎng)文本輸入，與完全版無異，主打低成本的API調(diào)用和快速響應(yīng)能力，適用于多種多模態(tài)應(yīng)用場(chǎng)景。

單價(jià)方面，每100萬Tokens僅為15美分，還不到一毛錢，比GPT-3.5 Turbo降價(jià)60%，是目前同級(jí)參數(shù)下性價(jià)比最高的大模型。

「GPT-4o mini」即日起上線ChatGPT并無償向網(wǎng)友提供使用，而GPT-3.5直接下線。

而其完整版的GPT-4o則是今年5月OpenAI發(fā)布的最新旗艦大模型，繼續(xù)以限量對(duì)話的方式免費(fèi)向用戶提供服務(wù)。

GPT-4o mini的推出，意味著OpenAI正試圖直面市場(chǎng)越來越多競(jìng)爭(zhēng)對(duì)手的局面，包括微軟Phi、谷歌Gemma、Anthropic Claude 3 Haiku在內(nèi)的產(chǎn)品，都主打小參數(shù)。所謂「以小博大」，在新式訓(xùn)練與蒸餾手段下，小參數(shù)模型并不比大參數(shù)的模型表現(xiàn)差，反而十分接近。

外媒CNBC對(duì)此評(píng)價(jià)，GPT-4o是OpenAI首個(gè)多模態(tài)模型，「GPT-4o mini」是OpenAI嘗試面向更多的用戶群體提供多模態(tài)應(yīng)用能力，讓ChatGPT可以駕馭文本、圖像、音頻和視頻等不同的媒介，同時(shí)繼續(xù)確保自己在行業(yè)內(nèi)的領(lǐng)導(dǎo)地位。