OpenAI發(fā)布GPT-4o mini丨知名大模型迎戰(zhàn)2024高考全科成績(jī)出爐丨蘋果否認(rèn)使用未授權(quán)YouTube視頻訓(xùn)練AI
AI奇點(diǎn)網(wǎng)2024年7月19日?qǐng)?bào)道丨AI資訊早報(bào)
當(dāng)?shù)貢r(shí)間7月18日,OpenAI在官網(wǎng)發(fā)布了最新的一款大模型GPT-4o mini,它是GPT-4o的小尺寸版本,具備文本、圖像、音頻、視頻的多模態(tài)推理能力。與GPT-4o保持一致,GPT-4o mini也支持128K的上下文窗口Tokens。
根據(jù)官方發(fā)布的測(cè)評(píng)報(bào)告顯示,GPT-4o mini的性能比GPT-4更好,大約有GPT-4o的80%能力。但API的價(jià)格卻大幅度下降了60%,每100萬tokens的輸入為15美分,每100萬tokens的輸出為60美分,是目前市面上性價(jià)比最高、性能最佳的大語言模型,其API單價(jià)甚至可以與國內(nèi)的大模型“價(jià)格戰(zhàn)”打得有來有往。
根據(jù)OpenAI公布的測(cè)試數(shù)據(jù)顯示,GPT-4o mini的數(shù)學(xué)、編碼、視覺等推理能力非常好,是目前最強(qiáng)的多模態(tài)小模型之一。
值得一提的是,從今天開始GPT-4o mini已經(jīng)取代了GPT-3.5 Turbo,免費(fèi)為注冊(cè)的ChatGPT用戶提供服務(wù),而GPT-3.5則完成了其歷史使命從ChatGPT上下線。同時(shí),這也是OpenAI發(fā)布的第一個(gè)基于指令層級(jí)結(jié)構(gòu)的模型。
目前,微軟已經(jīng)在 iOS / Android 平臺(tái)上發(fā)布了 AI 設(shè)計(jì)應(yīng)用 Designer 的預(yù)覽版,該應(yīng)用允許用戶通過模版創(chuàng)建自定義圖像、貼紙、賀卡、邀請(qǐng)函等,還能實(shí)現(xiàn) AI 編輯、重新設(shè)計(jì)圖像的進(jìn)階功能,用戶可以免費(fèi)使用 15 次進(jìn)階功能,Copilot Pro 訂閱用戶可以獲得 100 次。
去年,基于 DALL·E 3 開發(fā)的 Designer 最初可以在網(wǎng)頁端和微軟自家 Edge 瀏覽器上使用,現(xiàn)在擁有個(gè)人微軟賬戶的用戶都可以在 Windows 11、iOS 和 Android 平臺(tái)使用其免費(fèi)程序。
除了獨(dú)立應(yīng)用,微軟也在 Word、PowerPoint 中的 Copilot 助手添加了 Designer 支持,Copilot Pro 訂閱者可以在 Office 內(nèi)直接調(diào)用。
7月18日,科大訊飛對(duì)外發(fā)布消息,訊飛星火API正式開放長(zhǎng)文本上下文大模型——Spark Pro-128K,支持128K Tokens,價(jià)格最低0.21元/萬Tokens。
現(xiàn)如今,長(zhǎng)文本能力越來越受到模型開發(fā)商的青睞,區(qū)別于傳統(tǒng)的文本處理模型,長(zhǎng)文本模型具備更準(zhǔn)確的文本理解和生成能力以及更強(qiáng)大的跨領(lǐng)域遷移能力,可以一次性理解和生成更多的信息,適用于復(fù)雜的對(duì)話、長(zhǎng)篇內(nèi)容創(chuàng)作和詳細(xì)的數(shù)據(jù)分析等任務(wù),能提升模型解決問題的邊界。
今年6月27日,科大訊飛發(fā)布了星火大模型V4.0,并且宣布其長(zhǎng)文本能力得到提升,針對(duì)長(zhǎng)文檔知識(shí)問答的幻覺問題,業(yè)界首發(fā)「內(nèi)容溯源」功能。具體來說,星火大模型的回復(fù)里邊,會(huì)向用戶提供標(biāo)注大模型的回復(fù)是參考了哪一段的內(nèi)容,做到精準(zhǔn)溯源,可以輕松掌握信息采集來源的準(zhǔn)確性。
據(jù)AI奇點(diǎn)網(wǎng)了解,星火大模型 Spark Pro -128K 目前已經(jīng)在開發(fā)平臺(tái)面向所有開發(fā)者開放 API 調(diào)用,價(jià)格為 0.21~ 0.30 元 / 萬 Tokens,個(gè)人用戶可直接免費(fèi)領(lǐng)取 200 萬 Tokens 的嘗鮮免費(fèi)體驗(yàn)量。
7月17日,上海人工智能實(shí)驗(yàn)室對(duì)外發(fā)布了 7 款主流的 AI 大模型的高考全科目測(cè)試結(jié)果,據(jù)大模型開源開放評(píng)測(cè)體系“司南”相關(guān)負(fù)責(zé)人介紹,“當(dāng)前大模型仍存在很大的局限性。組織 AI 大模型們參加高考,目的是評(píng)測(cè)當(dāng)前大模型的真實(shí)水平,找準(zhǔn)問題,持續(xù)推進(jìn)技術(shù)進(jìn)步。”
繼上個(gè)月對(duì)外發(fā)布了大模型們參與 2024 高考「語數(shù)英」三科的成績(jī)后,上海人工智能實(shí)驗(yàn)室聯(lián)合司南評(píng)測(cè)近日對(duì) 7 個(gè) AI 大模型進(jìn)行了全科目測(cè)試,成績(jī)已公布:書生·浦語 2.0 系列文曲星大模型(浦語·文曲星)、阿里通義千問大模型 Qwen2-72B,以及 GPT-4o 包攬文科、理科的前三甲。
根據(jù)河南省分?jǐn)?shù)線,前三名的「 AI考生」的成績(jī)分別超過了文科一本線和理科二本線。
其中,阿里通義千問大模型 Qwen2-72B 以 546 分的成績(jī)獲 AI 高考「文科狀元」,浦語文曲星則以 468.5 分成為理科第一名??傮w上看,AI 考生的理科成績(jī)?nèi)跤谖目?,體現(xiàn)了大模型在數(shù)理推理能力上普遍存在短板。
日前,彭博社爆料蘋果、英偉達(dá)等科技巨頭在未獲得授權(quán)的情況下使用了大量的 YouTube 上知名創(chuàng)作者的優(yōu)質(zhì)內(nèi)容視頻,將該視頻的內(nèi)容音頻轉(zhuǎn)成字幕文檔素材,用于訓(xùn)練的自家的 AI 大模型。其中,我們了解到,蘋果公司向第三方采買了相關(guān)的數(shù)據(jù)訓(xùn)練了開源模型 OpenELM。
現(xiàn)在進(jìn)一步的追蹤進(jìn)展來了,蘋果公關(guān)人員回應(yīng)稱,OpenELM 作為一款開源模型,并不為任何的人工智能設(shè)備或者機(jī)器學(xué)習(xí)功能提供技術(shù)支持,包括旗下最新發(fā)布的蘋果AI智能服務(wù) 「Apple Intellegent」。
蘋果強(qiáng)調(diào),OpenELM 模型的目的是為研究社區(qū)作出貢獻(xiàn),推進(jìn)大語言模型開發(fā),僅用于研究目的。
按照蘋果的說法,由于 OpenELM 并非「Apple Intellegent」的一部分,因此蘋果從未使用未授權(quán)的 YouTube 視頻字幕作為訓(xùn)練數(shù)據(jù)。蘋果曾經(jīng)表示,「蘋果AI」使用的數(shù)據(jù)都是經(jīng)過許可和網(wǎng)絡(luò)爬蟲收集的公開數(shù)據(jù)。