亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁  >  資訊  >  文章
2024-05-27 11:27

資深媒體人:細(xì)數(shù)國產(chǎn)AI行業(yè)發(fā)展五大誤區(qū),我們至少落后美國十年

圖片

?演講人:趙何娟丨鈦媒體CEO

近日,由長(zhǎng)江商學(xué)院主辦、汕頭大學(xué)協(xié)辦的“2024長(zhǎng)江獨(dú)角獸峰會(huì)”上,鈦媒體CEO趙何娟發(fā)表主題“中國AI追隨之路的五大誤區(qū)”的演講。

以下為演講的主要內(nèi)容:

從AI 1.0的時(shí)代,鈦媒體就緊密地關(guān)注AI領(lǐng)域的發(fā)展,與美國相比,我們好像已經(jīng)有趕超的趨勢(shì)。但是到了AI 2.0時(shí)代,為什么會(huì)感到中國一夜之間好像就變得落后了。

今天我聽到一位嘉賓提到,為什么GPT火了之后中國的大模型很快就趕上來了,說明跟美國相比,中國的“臨門一腳”可能差了一點(diǎn)點(diǎn)。

但其實(shí)我現(xiàn)在想潑點(diǎn)冷水,我覺得短期來說我們可能有點(diǎn)太樂觀了。不僅對(duì)中國AI發(fā)展過于樂觀,而且可能對(duì)全球AI應(yīng)用爆發(fā)也過于樂觀了。

我認(rèn)為,短期內(nèi)沒有大家想象那么快,長(zhǎng)期沒有耐心,總想著是不是馬上能賺錢。

接下來我再詳細(xì)展開講一下。

AI領(lǐng)域今年最受關(guān)注的兩件事

近期,谷歌的AlphaFold 3發(fā)布、OpenAI的GPT-5即將發(fā)布。

AlphaFold 3是一個(gè)生物學(xué)領(lǐng)域關(guān)于蛋白和生命結(jié)構(gòu)預(yù)測(cè)的模型。使用了基于Transformer生成式模型和擴(kuò)散模型的結(jié)合,對(duì)于蛋白質(zhì)與其他分子的相互作用,與現(xiàn)有預(yù)測(cè)方法相比,AlphaFold 3預(yù)測(cè)精度提高100%以上。

AlphaFold 2預(yù)測(cè)精度比較初代至少翻了一倍,如今再翻了一倍。這個(gè)過程中相關(guān)科學(xué)家有過對(duì)比,這可能為生物研究界帶來了數(shù)億年的進(jìn)步,節(jié)省數(shù)萬億美元的研發(fā)經(jīng)費(fèi)。

也就是說如果不用AI大模型,我們靠研究人員自己去研究,可能要花數(shù)億年、花掉數(shù)萬億美元才能相同的計(jì)算效能。所以,這就是真正AIGC的力量。

但中國在此方面的研究成果幾乎是空白的。清華大學(xué)生命科學(xué)學(xué)院顏寧教授前兩年表示,AI不可能準(zhǔn)確預(yù)測(cè)蛋白相關(guān)結(jié)構(gòu),如今可以說被打臉了。

第二個(gè)就是GPT-5即將發(fā)布。

我認(rèn)為,這件事情帶來的震撼力不會(huì)低于AlphaFold 3的顛覆性技術(shù)影響。

為什么中國能快速發(fā)展很多模型,我覺得這個(gè)最重要的是感謝開源,因?yàn)镚PT-3之前OpenAI是開源的,包括谷歌Transformer論文也是開源的,GPT-3之后才轉(zhuǎn)成閉源了。

這意味著,從GPT-3到GPT-4本質(zhì)上已經(jīng)是一個(gè)巨大飛躍了。而即將發(fā)布的GPT-5.將再次實(shí)現(xiàn)比GPT-4質(zhì)的飛躍,解決諸多局限性。

我去年9月見到了OpenAI CEO奧特曼,他說過去一段時(shí)間OpenAI一直都在為GPT-5做準(zhǔn)備。

而這些令人震撼的進(jìn)展,在中國我可以悲觀一點(diǎn)叫“望塵莫及”,樂觀一點(diǎn)就是但凡對(duì)手能推出來,我們就有能力找到對(duì)標(biāo)進(jìn)行改善和追趕。

我接下來要重點(diǎn)談,為什么現(xiàn)在我們說,中國作為AI領(lǐng)域追隨者,要有追隨者的自覺,主要好好學(xué)習(xí)。明確我們目前所處的定位,避免走入發(fā)展誤區(qū)。

第一個(gè)誤區(qū):中美AI差距只有1~2年

我認(rèn)為很重要的就是,大家每次都談?wù)勚忻繟I差距大概是只有1~2年,那是不是真的就是1~2年,為什么會(huì)是1~2年?

因?yàn)闀?huì)有很多人說GPT-3發(fā)布就在2020年,那可能在2022年ChatGPT出來之后,我們也快速出來了類似于GPT-3相關(guān)的模型,GPT-4出來之后,我們也很快能出來一個(gè)對(duì)標(biāo)GPT-4水平的模型,就意味著我們相差的時(shí)間可能是1~2年,真的是這樣嗎?

我會(huì)覺得所有用這樣時(shí)間來表述差距的都是“耍流氓”,因?yàn)槟鞘侨思覄?chuàng)新迭代的代際時(shí)間,不是我們真實(shí)水平的差距時(shí)間。

如果說GPT-5現(xiàn)在不能出來,我們可能10年都追趕不上;但是GPT-5出來,我們可能也許花2~3年能趕上。

而GPT-5模型水平只是人家的創(chuàng)新節(jié)點(diǎn)、迭代時(shí)間水平,不是我們自己能力水平,這一點(diǎn)需要非常清楚,這也是我們本質(zhì)上的一個(gè)差距。

我們要看到,這真的是創(chuàng)新引領(lǐng)的差距,不是努力追趕兩年推出一個(gè)模型就改變了中美AI差距了。

第二個(gè)誤區(qū):中國是全球最大的AI專利與人才市場(chǎng)

我們常常會(huì)說,尤其是在AI 1.0的時(shí)代,中國投資人和創(chuàng)業(yè)者到硅谷做相關(guān)演講說,中國AI已經(jīng)領(lǐng)先于美國了。背后經(jīng)常會(huì)提到的一個(gè)指標(biāo)是,中國是全球最大的AI的專利和人才市場(chǎng)。

我們中國發(fā)布AI相關(guān)論文和申請(qǐng)AI專利的數(shù)量,可以說全球數(shù)一數(shù)二的,從事AI相關(guān)的人員數(shù)量,我們可以說全球數(shù)一數(shù)二。

但事實(shí)是什么樣的呢?

圖片

我們可以看這張圖,里面可以看到,新一代全球數(shù)字科技領(lǐng)域,大多數(shù)都是以AI相關(guān)論文的,中國排名確實(shí)是很高的。但是到相關(guān)頂尖論文的數(shù)量,或者說被引用論文次數(shù)的數(shù)量,我們的排名就掉下來了。

世界公認(rèn)標(biāo)準(zhǔn)Top1的頂尖論文數(shù)量,中國不僅低于美國,我們也低于德國、加拿大、英國等。

與此同時(shí),我們可以看到我們的AI人才密度。

中國確實(shí)在大學(xué)當(dāng)中培養(yǎng)出了大量的工程師、計(jì)算機(jī)領(lǐng)域人才,包括很多硅谷的大企業(yè)都到清華北大,直接在中國招聘計(jì)算機(jī)專業(yè)人才。

但是我們可以看到,即便是在2022年頂尖研究人員里面,雖然中國也是排在第二名左右,但是一上到頂級(jí)AI研究人員數(shù)量,只有美國的1/5左右。如今,2024年可能比兩年前更糟糕了。

所以這不是我們想的那樣,中國是全球AI人才大國。

第三個(gè)誤區(qū):中國AI發(fā)展的主要障礙是算力上被卡脖子

中國AI的主要障礙在于“算力卡脖子”。我們認(rèn)為算力卡了脖子,所以我們只要以各種手段能夠買到相關(guān)的芯片,那是不是就已經(jīng)達(dá)到相關(guān)水平了?

但是我想給大家潑一盆冷水的是,在這一輪AI 2.0的這一輪發(fā)展里面,不僅算力很重要,模型創(chuàng)新能力也很重要,數(shù)據(jù)能力也很重要。

因此,現(xiàn)在的事實(shí)是,我們不僅是“算力”是瓶頸,我們的底層模型的創(chuàng)新能力、數(shù)據(jù)能力都是“瓶頸”。

我先說數(shù)據(jù)能力,很多人覺得中國是一個(gè)很大的應(yīng)用市場(chǎng),中國的消費(fèi)者數(shù)據(jù),企業(yè)行為數(shù)據(jù)等等一定是很豐富的,但是我要非常殘忍的告訴大家,很多數(shù)據(jù)都是“無價(jià)值數(shù)據(jù)”,或者是“不可用數(shù)據(jù)”。

今年初,我跟美國氣象的一個(gè)華裔科學(xué)家,同時(shí)也是中國氣象科學(xué)研究院的顧問,在講到氣象數(shù)據(jù)的時(shí)候,我說我們也有相關(guān)的公司推動(dòng)了相關(guān)氣象計(jì)算預(yù)測(cè)的模型。

那個(gè)科學(xué)家就非常直白地說了一句——我們所有的氣象數(shù)據(jù)幾乎都是沒用的。因?yàn)槲覀內(nèi)狈?duì)歷史氣象數(shù)據(jù)的整理,缺乏氣象數(shù)據(jù)的歸納,缺乏氣象數(shù)據(jù)相關(guān)的整合,變成可計(jì)算的數(shù)據(jù)。

目前對(duì)于中國而言,什么“都缺”。

美國AI生態(tài)里面最重要的一個(gè)就是關(guān)于數(shù)據(jù)市場(chǎng)的建設(shè)。但在中國,理論上說是沒有數(shù)據(jù)市場(chǎng)的。這個(gè)就是生態(tài)建設(shè)能力里很重要的,建設(shè)一個(gè)成熟的數(shù)據(jù)市場(chǎng)。在國內(nèi),目前我們剛剛啟動(dòng)籌建大數(shù)據(jù)局。

中國的模型公司,可以說在中文的計(jì)算能力上相對(duì)來說是領(lǐng)先的,但是整個(gè)中國的數(shù)據(jù)市場(chǎng)占全球的數(shù)據(jù)市場(chǎng)不到1%,以及世界主流的論文數(shù)據(jù)、研究數(shù)據(jù),包括用戶數(shù)據(jù)絕大部分依然是英文數(shù)據(jù)。

所以如果我們不能很好的利用英文數(shù)據(jù),我們?nèi)绾文苄纬捎凶銐蚋?jìng)爭(zhēng)力的大模型,這個(gè)是很難的。

這就是為什么我說我們不要以為美國只是卡了我們的算力脖子,好像只在光刻機(jī)上發(fā)力就行了,實(shí)際上是整個(gè)生態(tài)能力建設(shè),從算力到底層模型的創(chuàng)新,到數(shù)據(jù)能力和數(shù)據(jù)市場(chǎng)的生態(tài)的建設(shè),我們整體都是落后的。

第四個(gè)誤區(qū):閉源 vs 開源大模型,誰更好?

前段時(shí)間,我們能看到企業(yè)家在爭(zhēng)論“閉源大模型好,還是開源大模型好”,我覺得這個(gè)事情根本不重要,只有哪種大模型更合適場(chǎng)景。

圖片

對(duì)于很多的應(yīng)用來說,或者對(duì)于我們的場(chǎng)景,我們其實(shí)是沒有必要每一個(gè)模型都算到萬億級(jí)那么大的,那么在一定程度上里說,開源模型并非不可以。

作為OpenAI這種領(lǐng)頭羊來說,它的目標(biāo)是要實(shí)現(xiàn)AGI通用人工智能這件事情來說,閉源可能會(huì)讓它有更快,更容易集中更多的資源、資金,更快的實(shí)現(xiàn)AGI這個(gè)目標(biāo)。

但是對(duì)于要來做全社會(huì)普及有更多的應(yīng)用和更多的迭代的速度來說的話,開源大模型也是非常必不可少的。

不管是哪一個(gè)更好,最重要的都是我們是否有自己的創(chuàng)新能力,是否有自己的原創(chuàng)性能力,減少重復(fù)造輪子。

假如說百模大戰(zhàn)也好,千模大戰(zhàn)也好,不能有任何的創(chuàng)新點(diǎn),只是在低階段的復(fù)制、內(nèi)卷,那么確實(shí)一個(gè)也不需要。

第五個(gè)誤區(qū):AI在各大垂直產(chǎn)業(yè)的爆發(fā)會(huì)很快發(fā)生

在中國我聽到最多的都是說,我們馬上要進(jìn)垂直產(chǎn)業(yè)的爆發(fā),今年都是大模型應(yīng)用爆發(fā)的元年。

我今年年初就跟一些朋友說,今年不可能是AI垂直產(chǎn)業(yè)爆發(fā)的元年,可以說是AI應(yīng)用剛剛開始起步,但不能說爆發(fā),不可能馬上爆發(fā),凡事都有基本運(yùn)行規(guī)律,一個(gè)產(chǎn)業(yè)、行業(yè)的發(fā)展都是有規(guī)律的。

而核心的原因在于,我們整個(gè)AI的基礎(chǔ)設(shè)施建設(shè)還沒達(dá)到產(chǎn)業(yè)廣泛應(yīng)用的標(biāo)準(zhǔn)。

如果說產(chǎn)業(yè)應(yīng)用必須要到90%的水平才推動(dòng)爆發(fā),那你此刻只有50%的水平,哪怕增長(zhǎng)到89%的水平,產(chǎn)業(yè)都不可能誕生快速爆發(fā)級(jí)的應(yīng)用。

大家不要認(rèn)為只有中國算力被“卡脖子”,而是全世界的算力都被“卡脖子”,美國企業(yè)也一樣被算力“卡脖子”。

OpenAI在推進(jìn)GPT-5、GPT-6的過程中速度依然還是很緩慢的,今天的AI大模型就是一個(gè)“暴力美學(xué)”——以足夠大的數(shù)據(jù)、算力、能源為前提,現(xiàn)階段明顯遇到了增速瓶頸。

有很多企業(yè)可能會(huì)指望說,中國公司認(rèn)為在技術(shù)創(chuàng)新能力上不如美國,但中國市場(chǎng)規(guī)模要比美國大、中國的應(yīng)用規(guī)模能力要比美國更強(qiáng),那么我是不是集中于創(chuàng)業(yè)做應(yīng)用,從而能快速獲得成功或者成果?

但我認(rèn)為,這件事長(zhǎng)期來看是正確的,但短期來看創(chuàng)業(yè)公司機(jī)會(huì)很小。

奧特曼曾經(jīng)說過,95%創(chuàng)業(yè)公司依附在大模型上開發(fā),但是大模型每次大規(guī)模迭代就會(huì)“消滅”一批企業(yè)。AI也不會(huì)違背一般的商業(yè)定律。

我今年跟AI視頻生成工具Pika的創(chuàng)始人在聊的時(shí)候,她自認(rèn)為最大的危機(jī)感,并不是競(jìng)爭(zhēng)對(duì)手Runway,她說最大的危機(jī)感是來自O(shè)penAI。

基礎(chǔ)建設(shè)能力還沒有達(dá)到為這個(gè)行業(yè)產(chǎn)生質(zhì)變的時(shí)候,它就不可能變成一個(gè)爆發(fā)式的AI應(yīng)用時(shí)代。

很多人說,中國移動(dòng)互聯(lián)網(wǎng)應(yīng)用就在全球領(lǐng)先,但我們現(xiàn)在所處的歷史時(shí)間點(diǎn)位置不是對(duì)應(yīng)互聯(lián)網(wǎng)時(shí)代。即AI當(dāng)下的發(fā)展階段,并不是“后互聯(lián)網(wǎng)”發(fā)展階段,而是相當(dāng)于思科公司早期增長(zhǎng)的階段。

今天的英偉達(dá)就像當(dāng)年的思科(英偉達(dá)最新股價(jià)突破1000美元),當(dāng)年思科在美國股票市場(chǎng)一騎絕塵,一年能漲60倍,那個(gè)時(shí)候有什么互聯(lián)網(wǎng)公司是值得一提的嗎?

那時(shí)候很多現(xiàn)在的互聯(lián)網(wǎng)公司可能都還沒有出現(xiàn)。后來也是基礎(chǔ)設(shè)施能力的提升,通信技術(shù)從2G到4G、5G的發(fā)展,網(wǎng)絡(luò)技術(shù)的提升、移動(dòng)互聯(lián)網(wǎng)、長(zhǎng)視頻短視頻的應(yīng)用逐漸出來。

現(xiàn)在的AI應(yīng)用,還是在幫助我們?cè)趺刺岣弋a(chǎn)業(yè)效率,但想要徹底改變這個(gè)行業(yè)來說還需要時(shí)間、需要耐心。

這就是為什么我們說,我認(rèn)為,目前還是「弱人工智能」,中國的龐大人口市場(chǎng)優(yōu)勢(shì)暫時(shí)無法發(fā)揮。短期內(nèi),還是輔助生成內(nèi)容的AI工具為主,比如搜索、問答、文生圖、文生音視頻等等。

那么,接下來,我們要如何應(yīng)對(duì)這些?

我覺得我們可能真的要形成一定的社會(huì)共識(shí),怎么在一個(gè)全球環(huán)境和AI發(fā)展過程中來做我們應(yīng)該做的事。

第一個(gè),加大基礎(chǔ)創(chuàng)新長(zhǎng)期能力建設(shè)。

這種生態(tài)能力建設(shè)非常重要,甚至要從教育開始抓起,比如建立AI普及教育、重新評(píng)估高校教育體系的評(píng)估標(biāo)準(zhǔn)、相應(yīng)的學(xué)術(shù)開放和交流的體系等,需要圍繞著AI本身的創(chuàng)新技術(shù)能力去重新匹配。同時(shí),我們也要提高大模型研發(fā)創(chuàng)新的基礎(chǔ)能力,沒有這個(gè)基礎(chǔ),其他的都是“無源之水”。

第二個(gè),是耐心面對(duì)各產(chǎn)業(yè)應(yīng)用場(chǎng)景的AI爆發(fā)周期。每個(gè)被AI改變的產(chǎn)業(yè)都面臨要從基礎(chǔ)底層技術(shù)改變開始的新周期,不會(huì)“一蹴而就”或者“一夜爆發(fā)”。

我認(rèn)為每個(gè)可能被AI改變的產(chǎn)業(yè),也都要面臨從底層基礎(chǔ)設(shè)施改變,并開啟一個(gè)產(chǎn)業(yè)的新周期,比如我們的媒體行業(yè)其實(shí)也要從底層周期開始變化,而不是說我馬上就在應(yīng)用層徹底變了,不是這樣的。包括相關(guān)的機(jī)器人行業(yè)、制造業(yè)、生物制藥行業(yè)等等都會(huì)發(fā)生顛覆性影響,但從這一點(diǎn)來說,我們的基礎(chǔ)科研能不能跟得上,這就變得非常重要了。

每一個(gè)產(chǎn)業(yè)都有自己的底層能力、從零開始的地基建設(shè),這個(gè)才是我們真正的產(chǎn)業(yè)周期。

第三個(gè),是用更開放態(tài)度。迎接全球AI建設(shè)的競(jìng)爭(zhēng)與挑戰(zhàn),不能自己卡自己脖子。

很多人都說,美國人卡我們的脖子,但現(xiàn)在我希望,我們自己不要卡自己的脖子。不要重復(fù)過去在低階段的復(fù)制式競(jìng)爭(zhēng),在AI創(chuàng)新層面更加激進(jìn)一些,往前多邁一步,要用更開放的態(tài)度去做這件事。

我希望,我們AI領(lǐng)域的研究,不要走新能源汽車的“老路”,10年前我們?cè)趧?dòng)力電池方面是有創(chuàng)新的,但看到今天,包括小米SU7的進(jìn)場(chǎng),我們卻在復(fù)制別人的成果,降價(jià)“內(nèi)卷”,這就意味著我們很難向前發(fā)展。

所以,我希望我們的基礎(chǔ)研究能力、創(chuàng)新能力能夠走得更快,能夠更耐心一點(diǎn)。

6
查看相關(guān)話題: #中國 #AI大模型

相關(guān)文章