亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁  >  資訊  >  文章
2024-08-21 17:15

不花一分錢!GPT-4o微調(diào)限時(shí)免費(fèi)開放,每日附贈(zèng)百萬訓(xùn)練token

一覺醒來,OpenAI又上新功能了:

GPT-4o正式上線微調(diào)功能。

并且官方還附贈(zèng)一波福利:每個(gè)組織每天都能免費(fèi)獲得100萬個(gè)訓(xùn)練token,用到9月23日。

圖片

也就是說,開發(fā)人員現(xiàn)在可以使用自定義數(shù)據(jù)集微調(diào)GPT-4o,從而低成本構(gòu)建自己的應(yīng)用程序。

要知道,OpenAI在公告中透露了:

GPT-4o微調(diào)訓(xùn)練成本為每100萬token 25 美元(意味著每天都能節(jié)省25美元)

收到郵件的開發(fā)者們激動(dòng)地奔走相告,這么大的羊毛一定要趕快薅。

圖片

使用方法也很簡單,直接訪問微調(diào)儀表盤,點(diǎn)擊”create”,然后從基本模型下拉列表中選擇gpt-4o-2024-08-06.

圖片

對了,OpenAI還提到,只需訓(xùn)練數(shù)據(jù)集中的幾十個(gè)示例就可以產(chǎn)生良好效果。

圖片

還曬出了成功案例

消息公布后,一眾網(wǎng)友躍躍欲試,表示很想知道模型微調(diào)后的實(shí)際效果。

圖片

OpenAI官方早有準(zhǔn)備,隨公告一同發(fā)布了合作伙伴微調(diào)GPT-4o的實(shí)際案例。

首先是一款代碼助手Genie,來自AI初創(chuàng)公司Cosine,專為協(xié)助軟件開發(fā)人員而設(shè)計(jì)。

據(jù)Cosine官方介紹,Genie的開發(fā)過程采用了一種專有流程,使用數(shù)十億個(gè)高質(zhì)量數(shù)據(jù)對非公開的GPT-4o變體進(jìn)行了訓(xùn)練和微調(diào)。

這些數(shù)據(jù)包括21%的JavaScript和Python、14%的TypeScript和TSX,以及3%的其他語言(包括Java、C++和Ruby)。

經(jīng)過微調(diào),Genie在上周二OpenAI全新發(fā)布的代碼能力基準(zhǔn)測試SWE-Bench Verified上,取得了43.8%的SOTA分?jǐn)?shù)。

圖片

與此同時(shí),Genie還在SWE-Bench Full上的SOTA分?jǐn)?shù)達(dá)到了30.08%,破了之前19.27%的SOTA紀(jì)錄。

相較之下,Cognition的Devin在SWE-Bench的部分測試中為13.8%。

另一個(gè)案例來自Distyl,這是一家為財(cái)富500強(qiáng)企業(yè)提供AI解決方案的公司,最近在領(lǐng)先的文本到SQL基準(zhǔn)測試BIRD-SQL中排名第一。

經(jīng)過微調(diào),其模型在排行榜上實(shí)現(xiàn)了71.83%的執(zhí)行準(zhǔn)確率,并在查詢重構(gòu)、意圖分類、思維鏈和自我糾正等任務(wù)中表現(xiàn)出色,尤其是在SQL生成方面表現(xiàn)尤為突出。

圖片

除了提供案例,OpenAI還在公告中特意強(qiáng)調(diào)了數(shù)據(jù)隱私和安全問題,總結(jié)下來就是:

開發(fā)者的業(yè)務(wù)數(shù)據(jù)(包括輸入和輸出)不會(huì)被共享或用于訓(xùn)練其他模型。

針對微調(diào)模型實(shí)施了分層安全緩解措施,例如不斷對微調(diào)模型運(yùn)行自動(dòng)安全評估并監(jiān)控使用情況。

圖片

網(wǎng)友:微調(diào)比不上提示詞緩存

一片熱鬧之際,有網(wǎng)友認(rèn)為微調(diào)仍然比不上提示詞緩存。

微調(diào)很酷,但它仍然不如提示詞緩存……

圖片

之前量子位也介紹過,提示詞緩存的作用,就是一次給模型發(fā)送大量prompt,然后讓它記住這些內(nèi)容,并在后續(xù)請求中直接復(fù)用,避免反復(fù)輸入。

今年5月,谷歌的Gemini就已經(jīng)支持了提示詞緩存,Claude也在上周上新了這項(xiàng)功能。

由于不需要反復(fù)輸入重復(fù)的腳本,提示詞緩存具有速度更快、成本更低這兩大優(yōu)勢。

有網(wǎng)友認(rèn)為,提示詞緩存功能對開發(fā)者更友好(無需異步微調(diào)),且?guī)缀蹩梢垣@得與微調(diào)相同的好處。

提示詞緩存可以讓您付出1%的努力獲得99%的好處。

圖片

不過也有人給微調(diào)打call,認(rèn)為微調(diào)在塑造響應(yīng)方面更有效。例如確保JSON格式正確、響應(yīng)更簡潔或使用表情符號等。

圖片

眼見OpenAI的競爭對手們相繼用上了提示詞緩存,還有人好奇了:

想知道OpenAI是否會(huì)堅(jiān)持微調(diào)或轉(zhuǎn)向提示詞緩存(或兩者兼而有之)。

對于這個(gè)問題,有其他網(wǎng)友也嗅出了一些蛛絲馬跡。

OpenAI在其延遲優(yōu)化指南中提到了緩存技術(shù)。

我們也第一時(shí)間找了下指南原文,其中在談到如何減少輸入token時(shí)提到:

通過在提示中稍后放置動(dòng)態(tài)部分(例如RAG結(jié)果、歷史記錄等),最大化共享提示前綴。這使得您的請求對KV緩存更加友好,意味著每個(gè)請求處理的輸入token更少。

圖片

不過有網(wǎng)友認(rèn)為,僅根據(jù)這一段內(nèi)容,無法直接推出OpenAI采用了提示詞緩存技術(shù)。

BTY,拋開爭議不談,OpenAI的羊毛還是得薅起來~

除了GPT-4o,還可以免費(fèi)微調(diào)GPT-4o mini,9月23日之前OpenAI免費(fèi)提供每天200萬個(gè)訓(xùn)練token。

圖片

3
查看相關(guān)話題: #OpenAI #chatgpt #GPT-4o

相關(guān)文章