OpenAI涉嫌違規(guī)使用YouTube視頻訓(xùn)練大模型丨阿里開源320億Qwen1.5模型丨奧特曼與蘋果前設(shè)計總監(jiān)合辦AI公司
AI奇點網(wǎng)2024年4月8日報道丨AI資訊早報
當?shù)貢r間4月6日,據(jù)《紐約時報》報道,該媒體引用消息人士的情報稱,OpenAI正在面臨嚴重的訓(xùn)練數(shù)據(jù)不足問題。隨著2021年底OpenAI發(fā)現(xiàn)訓(xùn)練素材越來越不夠用時,研究人員創(chuàng)建了一款名為「Whisper」的語音識別工具,用以將YouTube視頻轉(zhuǎn)錄為對話文本,最終轉(zhuǎn)錄了超100萬小時的YouTube視頻的對話內(nèi)容。
該公司將這些轉(zhuǎn)錄的視頻對白素材,用于訓(xùn)練GPT-4等大模型。YouTube官方曾發(fā)文稱,禁止將其平臺上傳的視頻用于其他獨立于該視頻平臺之外的應(yīng)用程序開發(fā),OpenAI的做法可能違反了YouTube的相關(guān)規(guī)則?!都~約時報》記者認為,OpenAI、谷歌和Meta在尋求在線信息來訓(xùn)練最新的AI系統(tǒng)時,都存在無視公司政策及規(guī)避版權(quán)法的行為。
阿里云通義千問今日開源320億參數(shù)模型Qwen1.5-32B,可最大限度兼顧性能、效率和內(nèi)存占用的平衡,例如相比14B模型,32B在智能體場景下能力更強;相比72B,32B的推理成本更低。迄今通義千問共開源了7款大語言模型,在海內(nèi)外開源社區(qū)累計下載量突破300萬。
基礎(chǔ)能力方面,通義千問320億參數(shù)模型在MMLU、GSM8K、HumanEval、BBH等多個測評中表現(xiàn)優(yōu)異,性能接近通義千問720億參數(shù)模型,遠超其他300億級參數(shù)模型。
通義千問此前已開源5億、18億、40億、70億、140億和720億參數(shù)6款大語言模型,是國內(nèi)開源大模型最多的研發(fā)機構(gòu)。此次開源的320億參數(shù)模型,將在性能、效率和內(nèi)存占用之間實現(xiàn)更理想的平衡,其希望32B開源模型能為企業(yè)和開發(fā)者提供更高性價比的模型選擇。
當?shù)貢r間4月4日,OpenAI官網(wǎng)宣布,將推出微調(diào)API新功能,并宣布擴展“自定義模型”的計劃,以幫助企業(yè)客戶開發(fā)更強大的定制生成式AI模型。為了讓開發(fā)人員能夠更好地控制模型微調(diào),OpenAI推出了基于Epoch的檢查點創(chuàng)建、模型比較、第三方集成、全面的驗證指標、超參數(shù)配置、微調(diào)儀表板改進等功能。同時,OpenAI將去年11月推出的自定義模型計劃擴展,宣布其輔助微調(diào)產(chǎn)品成為定制模型計劃的一部分。
據(jù)The Information報道,由前蘋果首席設(shè)計師喬納森·艾維(Jony Ive)和OpenAI CEO奧特曼創(chuàng)立的一家神秘AI公司近期已開始與風險投資領(lǐng)域的一些知名人士進行融資談判,二人正計劃創(chuàng)辦一家AI產(chǎn)品的開發(fā)公司。
一位參與該過程的人士表示,該公司已經(jīng)與Emerson Collective和Thrive Capital討論了交易,計劃籌集最多10億美元資金。
據(jù)The Verge報道,當?shù)貢r間4月3日,該網(wǎng)站的記者近期多次嘗試使用特殊定義的CP情侶詞匯來引導(dǎo)AI圖像大模型生成“亞洲男人和白人朋友”“亞洲男人和白人妻子”、“亞洲女人和白人丈夫”等提示詞來創(chuàng)建圖像,Meta的AI圖像生成器都無法勝任這種亞裔與白人合影的圖像生成需求。
對此該記者撰寫文章認為,目前諸多的AI系統(tǒng)的生成不準確問題時,會呈現(xiàn)其大模型研究者、創(chuàng)建者、培訓(xùn)者及其使用的訓(xùn)練數(shù)據(jù)集存在某種違背普世價值的人文偏見。
當?shù)貢r間4月3日,外媒NBC News報道,華盛頓州一名負責監(jiān)督三重謀殺案的法官在近期的裁決中禁止使用AI增強的視頻作為證據(jù),相關(guān)技術(shù)專家稱,該裁決可能是美國地區(qū)的刑事法院首例涉及到AI生成內(nèi)容作為呈堂證供的判例。
法庭文件顯示,一名男子被指控于2021年在西雅圖地區(qū)一家酒吧外開槍,造成三人死亡、兩人受傷,該男子的律師曾試圖引入經(jīng)過機器學習軟件AI增強的手機視頻作為呈堂的證據(jù)時,被法官駁回。裁決文件稱,增強后的圖像“不準確、具有誤導(dǎo)性且不可靠”。