谷歌大模型Gemini到底是打爆一切,還是徒有其表?
【視頻簡介】
谷歌發(fā)布的語言模型Gemini,并對其進(jìn)行了評價。作者認(rèn)為Gemini并沒有什么特別驚艷的地方只是針對圖像分析的一些簡單問題進(jìn)行回答。雖然AI領(lǐng)域的發(fā)展速度很快,但技術(shù)仍然需要沉淀和成長。作者認(rèn)為現(xiàn)在的AI技術(shù)已經(jīng)到了一個平臺期,將從縱向發(fā)展轉(zhuǎn)向橫向發(fā)展與其他技術(shù)進(jìn)行融合,解決更多的工作問題。同時,作者也對AI領(lǐng)域的發(fā)展持積極態(tài)度。
【視頻時間軸】
谷歌的GEMINI模型通過攝像頭分析圖像但其實這種技術(shù)并不新鮮也存在一些問題
00:01谷歌大模型Gemini的視覺展示
01:13語言模型通過攝像頭分析物體和人物運動
03:39谷歌模型的背后痕跡和引導(dǎo)
AI技術(shù)的發(fā)展趨勢.強調(diào)了橫向發(fā)展和縱向發(fā)展的區(qū)別并提到了谷歌的大預(yù)言模型。
04:45AI領(lǐng)域發(fā)展到一定階段的成果,包括生成式內(nèi)容、橫向發(fā)展等。
07:10AI發(fā)展的影響,包括數(shù)據(jù)量、模型發(fā)展、傳統(tǒng)技術(shù)結(jié)合AI等。
09:08AI在專業(yè)領(lǐng)域和商業(yè)應(yīng)用中的限制,包括算力、速率、滿足不了專業(yè)需求等。
人工智能的發(fā)展方向,包括圖像、音頻和文字的生成,以及comfyUI的使用和比較
09:26人工智能在各個領(lǐng)域的應(yīng)用場景都在不斷拓展,如圖像、文字、音頻等。
12:37ConfyUI的效率和價值,以及與Web UI的比較。
13:41視頻應(yīng)用新工作流程:視頻應(yīng)用的新工作流程和相關(guān)討論。
如何獲取潘多拉的session token以及登錄賬號時遇到的問題并介紹了AI繪畫的模組和文件位置。
14:33永久登錄賬號和身份驗證解決方法
18:16拓展模塊使用方法和注意事項
18:28沒有響應(yīng)的原因和解決方法
如何解決下載時連接失敗的問題并詳細(xì)講解了報錯中的下載地址和路徑。
18:56視頻中提到了一個下載huggingface模型的步驟,需要仔細(xì)查看報錯信息,找到缺失的模型,并放到正確的路徑。
19:22整個文件夾打包:視頻中還提到了整個文件夾打包的操作,需要根據(jù)報錯信息找到缺失的文件。
20:07解決下載問題:視頻最后提到了解決下載問題的步驟,需要仔細(xì)查看后臺提示,找到下載網(wǎng)址。