專(zhuān)家研究稱(chēng)「經(jīng)常使用生成式AI工具撰寫(xiě)論文會(huì)讓人變蠢」,國(guó)外這份調(diào)研報(bào)告說(shuō)清楚了
以下文章來(lái)自于丨新硅
經(jīng)常延畢的同學(xué)都知道,寫(xiě)論文最怕的當(dāng)然是查重。自己辛辛苦苦拼寫(xiě)的論文,一看查重率,直接去翟天臨微博下問(wèn)候十幾條評(píng)論。
不過(guò)這問(wèn)題自去年各種AIGC工具和軟件出現(xiàn)以后,似乎就再?zèng)]引起過(guò)討論,早有知乎大V手把手教學(xué)如何使用AI降重。
但AI的能力遠(yuǎn)不止降重這么簡(jiǎn)單,小到寫(xiě)一篇論文,大到通過(guò)司法考試,它都能做到。
沃頓商學(xué)院教授發(fā)現(xiàn),ChatGPT在MBA課程運(yùn)營(yíng)管理中的考試成績(jī)超過(guò)了不少學(xué)生。而能力更強(qiáng)的GPT4.剛發(fā)布時(shí),就以平均分75的成績(jī)通過(guò)了美國(guó)法考,超過(guò)了90%的人類(lèi)考生。
面對(duì)擁有超能力的AI,大家也是來(lái)者不拒。有些人甚至直接用AI寫(xiě)的內(nèi)容投稿,改都不改。
今年4月的一篇醫(yī)學(xué)論文《成功治療4個(gè)月大女?huà)氲尼t(yī)源性門(mén)靜脈及肝動(dòng)脈損傷:病例報(bào)告及文獻(xiàn)綜述》中,直接出現(xiàn)了“我是一個(gè)AI大模型,所以沒(méi)有真實(shí)的病人數(shù)據(jù)”這樣的內(nèi)容。
但ChatGPT能力再?gòu)?qiáng),其本質(zhì)也只是對(duì)已有的內(nèi)容進(jìn)行模仿重復(fù),用它來(lái)寫(xiě)論文和考試作弊沒(méi)什么區(qū)別。不少期刊已經(jīng)開(kāi)始不鼓勵(lì)或者拒絕AI生成的學(xué)術(shù)內(nèi)容。
我國(guó)在學(xué)位法(草案)中明確寫(xiě)道,直接將人工智能代寫(xiě)論文定義為學(xué)術(shù)不端行為。
但無(wú)論如何禁止學(xué)生使用AI寫(xiě)論文,總有人會(huì)冒險(xiǎn),只有讓學(xué)生自發(fā)的,從心底里抗拒用AI作弊才行。
就像疫情期間為了讓所有人都戴上口罩,專(zhuān)家跑出來(lái)說(shuō)病毒會(huì)影響性功能一樣。
巴基斯坦國(guó)立計(jì)算機(jī)與新興科學(xué)大學(xué)(2023年QS全球排名421)的學(xué)者M(jìn)uhammad Abbas,另辟蹊徑,做了個(gè)嚴(yán)謹(jǐn)?shù)膶?shí)驗(yàn),試圖證明用AI寫(xiě)論文會(huì)導(dǎo)致智商下降,讓學(xué)生拒絕使用AI寫(xiě)作業(yè)。
Abbas表示:“在過(guò)去一年里,我觀(guān)察到我的學(xué)生們?cè)谕瓿晌也贾玫母黜?xiàng)作業(yè)和項(xiàng)目時(shí),越來(lái)越多地、不加批判地依賴(lài)生成式AI工具。這促使我深入探究他們使用這些工具的根本原因和后果”。
該研究分為兩個(gè)階段進(jìn)行。
首先,研究人員開(kāi)發(fā)了一個(gè)變量表,用來(lái)衡量學(xué)生在學(xué)習(xí)上使用ChatGPT情況。
變量表的類(lèi)目包括“我使用ChatGPT來(lái)完成課程作業(yè)”“我依賴(lài)ChatGPT來(lái)幫助我的學(xué)習(xí)”“ChatGPT是我校園生活的一部分”等。
這一塊是想測(cè)量到底有多少學(xué)生會(huì)使用AI來(lái)完成學(xué)業(yè),并且是否依賴(lài)AI。
此表為了檢測(cè)變量是否相關(guān),簡(jiǎn)單來(lái)說(shuō)就是作者在學(xué)術(shù)上為了證明這張表不是胡編的
第二階段,研究者調(diào)查影響學(xué)生使用ChatGPT的原因,包括學(xué)術(shù)工作量、時(shí)間壓力、對(duì)成績(jī)的擔(dān)心程度以及對(duì)內(nèi)容質(zhì)量的感知程度等。
測(cè)量后,研究者會(huì)評(píng)估使用ChatGPT對(duì)學(xué)生在拖延癥、記憶力是否減退和學(xué)習(xí)成績(jī)等方面的影響,并每隔一至兩周進(jìn)行復(fù)查。
作者的研究模型
研究發(fā)現(xiàn),高強(qiáng)度的學(xué)術(shù)工作量(H1)和時(shí)間壓力(H2)是ChatGPT使用量增加的主要因素,這意味著在面臨高學(xué)業(yè)負(fù)擔(dān)和時(shí)間緊迫的情況下,學(xué)生更有可能求助于AI工具。
這很好理解,作業(yè)都快做不完了,AI這根救命稻草能抓牢還是要抓一下的,當(dāng)然,也有可能是因?yàn)榇髮W(xué)生天然就有拖延癥屬性。
而更擔(dān)心成績(jī)的學(xué)生則不太愿意使用
這是什么隔壁小孩式的發(fā)言?對(duì)于老師不允許做的事情,他們不敢越雷池一步。
有趣的是,研究并沒(méi)有發(fā)現(xiàn)質(zhì)量敏感性與使用ChatGPT之間的顯著關(guān)系(H4),這表明學(xué)生對(duì)學(xué)術(shù)內(nèi)容質(zhì)量的重視程度并不一定會(huì)影響其使用AI工具。
也就是說(shuō),學(xué)生其實(shí)并不在意AI做出來(lái)的東西質(zhì)量高不高,能交差就行。
此表是呈現(xiàn)什么原因會(huì)導(dǎo)致學(xué)生使用ChatGPT,以及使用ChatGPT的后果
簡(jiǎn)單解釋一下這張表(同下表),Path列代表路徑,比如H1行中,學(xué)術(shù)工作量(Workload)會(huì)導(dǎo)致學(xué)生使用ChatGPT。
系數(shù)(Coefficient)代表兩個(gè)因素之間的關(guān)系,以H1的0.133為例,代表學(xué)生的學(xué)術(shù)工作量越大,就越會(huì)使用ChatGPT。
T和P列,是為了在學(xué)術(shù)上證明這個(gè)研究假設(shè)在統(tǒng)計(jì)學(xué)上成立不成立。
其實(shí)!我們直接看最后一列Status就好了,統(tǒng)計(jì)量大小對(duì)于看樂(lè)子的我們沒(méi)多大影響。
再來(lái)看一下,使用ChatGPT會(huì)對(duì)學(xué)生學(xué)習(xí)表現(xiàn)會(huì)造成什么影響(H5、H6、H7)。
一句話(huà),研究發(fā)現(xiàn)使用ChatGPT對(duì)學(xué)生個(gè)人能力和學(xué)業(yè)成績(jī)都會(huì)產(chǎn)生顯著的不利影響。越依賴(lài)ChatGPT的學(xué)生,越容易拖延,記憶障礙也更頻繁出現(xiàn),并對(duì)學(xué)業(yè)成績(jī)產(chǎn)生負(fù)面影響。
原因也很簡(jiǎn)單,不論AI給出的回答是好是壞,都讓作業(yè)變得更簡(jiǎn)單了,全權(quán)交給AI完成,而不用自己的腦子思考,怎么還會(huì)有心思規(guī)劃作業(yè)進(jìn)度、復(fù)習(xí)知識(shí)點(diǎn)呢?
想想也是啊,反正作業(yè)考試都有AI幫忙,學(xué)生學(xué)習(xí)的時(shí)候也不會(huì)認(rèn)真,課后也缺乏思考。
作者對(duì)學(xué)生使用ChatGPT的原因,以及對(duì)學(xué)業(yè)表現(xiàn)的影響做了更深度的分析。
上邊此表是呈現(xiàn)學(xué)生因?yàn)楦鞣N原因使用ChatGPT后,對(duì)學(xué)習(xí)表現(xiàn)的影響。
作者發(fā)現(xiàn)了一個(gè)連鎖反應(yīng):那些被作業(yè)和時(shí)間緊迫感壓得喘不過(guò)氣來(lái)的學(xué)生,更容易一頭扎進(jìn)ChatGPT的懷抱,同時(shí)也更容易染上拖延的惡習(xí)。
這就像是開(kāi)啟了一個(gè)惡性循環(huán),記憶力隨之每況愈下,學(xué)習(xí)成績(jī)自然也就一落千丈。
而擔(dān)心成績(jī)的學(xué)生則相反,他們不太使用ChatGPT,因此拖延和記憶力衰退的程度更低,但這種自我約束對(duì)學(xué)業(yè)成績(jī)并沒(méi)有顯著影響。
既然作業(yè)多、時(shí)間緊,那是不是老師不布置那么多學(xué)業(yè)任務(wù)就好了?(這才是重點(diǎn))
看完后作者發(fā)現(xiàn),這研究是針對(duì)學(xué)生的,打工人完全不用擔(dān)心了?!
當(dāng)然不是,Abbas表示:“普通人應(yīng)該認(rèn)識(shí)到過(guò)度使用生成式AI的陰暗面。雖然這些工具提供了便利,但它們也可能導(dǎo)致負(fù)面后果”。
同月《神經(jīng)心理學(xué)》雜志發(fā)表了一篇關(guān)于AI可能影響人類(lèi)認(rèn)知發(fā)展的論文,狠狠打了臉。
該論文的作者同樣表達(dá)了對(duì)學(xué)生利用AI工具的擔(dān)憂(yōu),“像ChatGPT這樣工具的出現(xiàn),讓我擔(dān)心學(xué)生可能會(huì)使用它來(lái)完成任務(wù),從而阻止對(duì)認(rèn)知功能的刺激”。
作者提出了一個(gè)論點(diǎn),AI可以充當(dāng)“認(rèn)知假體(cognitive prosthesis)。
即AI可以代表人類(lèi)去執(zhí)行認(rèn)知任務(wù),就像假肢替代失去的肢體一樣,不僅僅包括計(jì)算、安排時(shí)間等簡(jiǎn)單任務(wù),還擴(kuò)展到了更復(fù)雜的認(rèn)知功能,例如決策、解決問(wèn)題等人類(lèi)特有的能力。
短期來(lái)看,生成式AI增強(qiáng)決策的功能可以幫助個(gè)人更快更好做出選擇,更專(zhuān)注于重要任務(wù),但是長(zhǎng)期來(lái)看可能會(huì)帶來(lái)潛在風(fēng)險(xiǎn)。
關(guān)鍵問(wèn)題就在于“認(rèn)知卸載(cognitive offloading)”。
簡(jiǎn)單來(lái)說(shuō)過(guò)度依賴(lài)AI會(huì)導(dǎo)致我們獨(dú)立執(zhí)行認(rèn)知任務(wù)的能力下降。就像肌肉不鍛煉會(huì)萎縮一樣,人們不經(jīng)常使用認(rèn)知能力,它也會(huì)逐漸退化。
也就是說(shuō),如果人們不“卸載”,一直使用AI,是不是就不會(huì)有問(wèn)題了?
總而言之,AI對(duì)于人類(lèi)認(rèn)知的影響可不單單作用在學(xué)業(yè)上,任何人過(guò)度使用AI工具的負(fù)面影響都不容小覷。自ChatGPT誕生之后,AI工具就已經(jīng)成為了學(xué)生們的新型“學(xué)習(xí)伙伴”。
早在去年1月,根據(jù)美國(guó)在線(xiàn)課程供應(yīng)商Study.com對(duì)美國(guó)的1000名18歲及以上的學(xué)生進(jìn)行的一項(xiàng)調(diào)查,每10個(gè)學(xué)生中就有超9個(gè)知道ChatGPT,超過(guò)89%的學(xué)生承認(rèn)使用ChatGPT來(lái)幫助完成家庭作業(yè)。讓學(xué)生完全禁止使用AI工具似乎不太可能,面對(duì)AI的潛在風(fēng)險(xiǎn),我們能做到也許只有保持自己的大腦不斷運(yùn)轉(zhuǎn)。
想象中AI像個(gè)家庭教師,為每個(gè)學(xué)生提供個(gè)性化教學(xué),但現(xiàn)實(shí)是,AI幫學(xué)生寫(xiě)作業(yè)。
當(dāng)然,這兩項(xiàng)研究告訴我們的不僅僅是學(xué)生該謹(jǐn)慎使用AI,而是我們每個(gè)人都要注意不能過(guò)分依賴(lài)AI。
別在AI替代人類(lèi)之前,人類(lèi)就已經(jīng)成為了技術(shù)的奴隸了。