Kimi上線探索版,單次精度500頁丨快手推出Pyramid Flow開源文生視頻模型丨特斯拉無人駕駛Cybercab驚艷亮相
通用人工智能創(chuàng)業(yè)公司——月之暗面當(dāng)日正式發(fā)布可自主海量搜索解決復(fù)雜問題的Kimi探索版。Kimi 探索版具備AI自主搜索能力,可以模擬人類的推理思考過程,多級(jí)分解復(fù)雜問題,執(zhí)行深度搜索,并即時(shí)反思改進(jìn)結(jié)果,提供更全面和準(zhǔn)確的答案,幫助用戶更高效地完成分析調(diào)研等復(fù)雜任務(wù)。
Kimi探索版的搜索量是普通版的10倍,一次搜索即可精讀超過500個(gè)頁面。在內(nèi)部性能評(píng)估測(cè)試中,Kimi的性能評(píng)估團(tuán)隊(duì)結(jié)合1000多個(gè)來自用戶的真實(shí)長(zhǎng)難問題,對(duì)比了國(guó)內(nèi)外所有的主流AI助手和搜索類產(chǎn)品,包括付費(fèi)和專業(yè)版本,Kimi探索版的回答準(zhǔn)確性和完整性具備全面優(yōu)勢(shì),綜合性能超過同類產(chǎn)品至少30%。
“如果Kimi搜不到的信息,那大概率用戶也很難自己通過傳統(tǒng)搜索引擎找到。未來搜索引擎會(huì)成為AI更擅長(zhǎng)調(diào)用的工具,人只需要專注于提出好的問題,AI就可以結(jié)合模型本身的能力在龐大的互聯(lián)網(wǎng)中自主海量搜索,不斷反思迭代,更精準(zhǔn)地定位所需答案。”Kimi探索版產(chǎn)品負(fù)責(zé)人表示。
Kimi 探索版已逐步分批上線 Web 端(kimi.ai),預(yù)計(jì)下周一前至全量用戶。收到更新的用戶,只需打開對(duì)話框左下角的「探索版」開關(guān),或者直接在對(duì)話框中輸入斜杠“ / ”,就可以喚醒 Kimi 探索版,讓 Kimi 與你一起探索更復(fù)雜問題的答案。
為了確保更多人可以用起來,Kimi 探索版目前每人每天可以使用 5 次。除了網(wǎng)頁版之外,Kimi 智能助手的手機(jī)APP也將在近期上線該功能。
由快手科技、北京大學(xué)和北京郵電大學(xué)聯(lián)合組建的研究團(tuán)隊(duì)推出 Pyramid Flow 文生視頻模型,用戶在輸入文本之后,即可生成最長(zhǎng) 10 秒、分辨率高達(dá) 1280x768、幀率 24fps 的高質(zhì)量視頻。
Pyramid Flow 文生視頻模型主要面向開發(fā)者、藝術(shù)家和創(chuàng)作者等,提供更高效、更靈活的視頻生成解決方案,目前已經(jīng)在 Hugging Face 平臺(tái)上線,并完全開源。
Pyramid-Flow僅通過文本就能生成最多10秒、1280x768分辨率和24幀視頻,在光影效果、運(yùn)動(dòng)動(dòng)作一致性、視頻質(zhì)量、文本語義還原、色彩搭配等方面非常優(yōu)秀,生成的視頻很棒。
值得一提的是,Pyramid-Flow使用A100 GPU在開源數(shù)據(jù)集上僅訓(xùn)練了20.700小時(shí),其能耗和生成效率比市面上同類開源視頻模型好很多,對(duì)于沒有大量算力的中小企業(yè)和個(gè)人開發(fā)者來說幫助很大。
附上 Pyramid Flow 的核心特點(diǎn)如下:
高效生成:Pyramid Flow 采用新技術(shù),通過統(tǒng)一 AI 模型分階段生成視頻,大多數(shù)階段為低分辨率,只有最后階段為全分辨率。這種“金字塔流匹配”方法保持了視頻的高視覺質(zhì)量前提下,大幅降低了計(jì)算成本,tokens 數(shù)量是傳統(tǒng) diffusion 模型的四分之一。
快速推理:在推理過程中,該模型可以在 56 秒內(nèi)生成一個(gè) 5 秒、384p 的視頻,速度媲美許多全序列 diffusion 模型,甚至更快。
開源和商業(yè)使用:Pyramid-Flow 在 MIT 許可證下發(fā)布,允許廣泛的使用,包括商業(yè)應(yīng)用、修改和再分發(fā),吸引了希望將模型集成到專有系統(tǒng)中的開發(fā)者和公司。