耿同學,一個退學博士是怎麼用AI降維打擊學術圈的?



頭圖來自:AI生成

2026年的春夏之交,中國學術圈和文學圈接連經歷了兩場“地震”。

學術圈的震中,是一個叫“耿同學講故事”的B站up主。36天時間裡,他連續實名舉報了5位985高校院長級學者的論文造假,被點名的無一例外都是手握國家傑出青年科學基金和“長江學者”等頭銜的資深學者。

文學圈的震中,是一個叫“抒情的森林”的普通網友。從2024年10月開始,他用逐字逐句的文字對比,一年多時間內點名了近40位作家涉嫌抄襲——從86歲的楊本芬,到賈平凹、賈淺淺父女,再到蔣方舟等中生代與青年作者,覆蓋文壇老中青三代。

一個是生物醫學退學博士,一個是普通讀書人;一個用的是AI圖片查重和統計學工具,一個靠的是肉眼比對和查重軟體。兩個普通人,憑著各自的“武器”,正在撼動兩個領域的權威。

這聽起來像是兩個“憤青”打假的故事。但仔細一想,這裡面還有更多值得思考的地方,那就是AI時代的到來,當普通人也能使用技術工具,監督權不再是少數人的特權,正在交還給每一個會使用工具的人。

當然,更深層的問題是,當一個體系需要靠一個退學博士來糾錯時,到底該從那些方面來改進?

打假門檻低了

這場風暴最讓人震驚的地方,不是耿同學有多厲害,而是他用的方法竟然出奇地“低門檻”。

在中國學術圈,過往的學術打假是極少數人的能耐。要麼你是同領域學者,要麼得像饒毅那樣有學界影響又有揭露問題的勇氣,普通人連Nature這種期刊的文章都未必能完全讀懂,更別提找出資料造假的痕跡了。造假者佔盡了所有便宜,專業壁壘讓外行人無從下手,學術共同體的“熟人社會”讓內行人睜一隻眼閉一隻眼,期刊審稿人時間精力有限只能基於信任評審。這三個門檻對普通人來說太高了,也因此讓造假長期是一種“低成本、高回報”的選擇。

而耿同學的打法和所有人都不一樣。他不跟你討論高深的生物學機制,不需要在Nature發過論文才有資格質疑你。他的武器是AI輔助的圖片和資料查重技術。

他的操作方法被技術圈拆解過,核心流程其實只有三步:把一篇論文的PDF拆成文字、表格和圖片,再把資料交給AI做審查。

具體來說,他重點檢查三個地方:

第一,看資料末尾數字分佈是否過於集中。真實的實驗資料因為測量誤差的存在,小數點後一位乃至兩位應該是隨機分佈的,而造假資料則會出現大量“5”“0”或某個數字完全消失的情況。

第二,看不同量表之間的資料有沒有雷同。比如基因表達量的資料序列和腫瘤體積的資料序列,本該毫不相干的實驗卻出現了幾個數值完全相同。

第三,用視覺大模型檢查圖片有沒有被篡改或重複使用。

耿同學自己有一句話說得極妙,在揭露中山大學鄺棟明的論文造假時,他說:“這不僅是學術界的恥辱,更是造假界的恥辱。連隨機數生成器都不會用的人,也配學術造假?”

資料造假被發現,根本原因往往不是造假者技術太差,而是太敷衍。中山大學康鐵邦論文中被質疑的實驗圖片,被網友形容為“像是從不同論文裡直接複製貼上的”。上海大學蘇佳燦的論文資料中,一組資料直接呈等差數列,“人為編造痕跡明顯”。就連同濟大學王平的那篇Nature論文,196隻小鼠的體重資料中也出現了一隻末位為“0”的離群值,這在統計學上是極不自然的。

耿同學對此的概括非常直白:“編造者甚至沒有花心思和時間去做一組隨機資料,而是完全隨心所欲地人為亂填。如果用心去編,其實我是看不出來的。”

這恰恰說明技術逼出了造假者的真實水平。一個在造假時都不願意花心思的人,足以說明在這個生態裡,造假已經成了一種常規操作,沒有人覺得會被發現。

本質上,耿同學只不過是把學術爭議從學術辯論降維成了資料判斷題。他沒有和你去爭論學科裡面的那些高深的知識,只是從大多數隻需要有一定觀察與推理能力就可以發現的問題問你:

這組資料的末位分佈符合統計學規律嗎?這兩張圖片相似度是多少?這組資料有沒有在其他表格中出現過?

這些都是可以用演算法來回答的,而且答案只有“是”或“否”,沒有任何灰色地帶。

不得不說,耿同學這套打法已經成了可複製的、人人都能掌握的工具,只要是有心人都可以試試。

文學圈的迴響

如果說耿同學的故事是“技術賦能”的第一版本,那麼“抒情的森林”的故事就是第二版本——它同樣印證了技術正在把監督權從中心推向邊緣,只不過用的是另一種工具。

抒情的森林是誰?從公開資訊來看,他是一位普通的讀書博主。從2024年10月開始,他陸續公開了數十位作家已出版作品中與其他作家相似的部分語句和段落,引發輿論劇震。

他在一次採訪中坦陳:“我從0人關注開始發帖,很少下判斷,只呈現文字對比。直到今天,我更多的也只是展示事實本身,將判斷交給看帖子的人。”

過去界定抄襲,需要專家意見,需要法律程序,需要大量的專業辯論。而現在,抒情的森林只用了最基礎的“文字比對”——這是任何一個識字的人、會使用搜尋引擎的人都能獨立完成的。

比如,他把賈平凹的《三十未立》和美國作家華盛頓·歐文《英國的農村生活》並列排在一起,讓讀者看到兩段文字幾乎完全相同,這樣簡單的技術工具就可以讓傳統上依賴專家權威才能做的事情,變成了任何人都能參與的“判斷題”。

在這一點上,耿同學和抒情的森林是殊途同歸的,一個靠的是AI圖片比對和統計學分析,把高深的學術論文變成了資料題;另一個靠的是文字比對和網際網路搜尋,把模糊的抄襲爭議變成了直觀對照。

抒情的森林面對“你是不是為了流量”的質疑時的回應同樣值得品味。他說:“我無法阻止別人的質疑,甚至歡迎別人的質疑,但大家凡事不要代入過甚,以己度人,流於誅心之論。講話儘量有理有據,至少我自己是這樣要求自己的。你質疑的,有根據嗎?”

用證據說話,君子論跡不論心,當證據足夠清晰,動機就成了無關變數。

風暴背後

技術的發展讓普通人擁有了質疑權威的能力,很多人把這稱為“技術平權”,技術賦予了普通人挑戰權威的能力,這是積極的一面。但這場風暴另一個值得深思的問題是:為什麼“耿同學”和“抒情的森林”做的,本該是體制本身應該做的事?

耿同學本人對此有一個非常坦率的觀察:“這段時間做打假以來,沒有任何一篇問題論文,是官方自己去找出來的。這是迄今為止讓我感到最失望的一點。”

他公開承認,自己發佈的每一篇造假論文,“都不是我自己閒著沒事去扒拉的,而是我認識的朋友或者熱心網友先發現了,再轉發給我的”。也就是說,發現問題的人,壓根不是那些本該在稽核機制裡把關的人。

抒情的森林也遭遇了同樣的現象——被點名的近40位作家,除了86歲的楊本芬發文致歉,絕大多數選擇沉默。學術圈也幾乎是同一個劇本:除了饒毅等極少數人發聲,那些平時活躍的院長們、傑青們集體沉默。沒人說這是污衊,因為證據就在那兒;也沒人否認,因為承認就等於承認自己和他們是一夥的。

在一個健康的社會裡,學術論文有沒有問題,理應由學術共同體的內部稽核機制來保障;文學作品是否抄襲,理應由出版行業自律和作者誠信來維繫。但現在,這些本該由體制完成的事情,卻要依靠兩個“志願者”用業餘時間來完成,這是遠遠不夠的。

耿同學的視訊火了後,同濟大學的王平已經被免去院長職務,降低專業技術崗位等級兩級,涉事論文第一作者被解除聘用關係。南開大學、中山大學、上海大學都已成立調查組。

5月17日,耿同學再次發佈視訊,喊話四所高校的五位“傑青”,要求他們先自查整改,否則將再次舉報。據他透露,這幾篇被質疑的論文均涉及Nature正刊或子刊。他對《三聯生活周刊》透露,第一條打假視訊發出後,他已經收到超過100條打假舉報。

也就是說,我們目前看到的,可能只是冰山一角。

對於這場風暴,我們不能止步於揪出幾個造假者,它應該催生更深層的變革,比如監督機制的現代化,Nature出版社母公司在2025年就已經開始用AI做論文審查,沒錯,就是用AI來查造假。事實證明,其實基礎的審查技術方案已經很成熟了,統計學檢驗、AI圖片比對、資料查重,那一樣是今天的技術做不到的?問題不在於“能不能做”,而在於“願不願意做”。

又比如,當前的科研評價體系是不是需要變革了,當論文數量、項目經費、人才“帽子”與資源分配深度繫結時,學術就容易被異化成一場“績效競賽”,很多造假也就是這樣來的,畢竟這些造假的背後都是利益。

技術賦予每一個普通人以力量,但技術永遠不能替代制度。耿同學和抒情的森林只是拋出問題的揭蓋子的人,他們扔下的雷,最後還要由體制本身來接。

但這一次,我們再也無法假裝看不見了,因為AI時代來了,你可以繼續造假,但你要面對的不再是一個博主的質疑,而是全世界無數人的AI工具;你可以繼續抄襲,但你要面對的不再是幾個專家的評判,而是全網任何人都能參與的“文字比對”。在你造假的時候,你就應該問問自己,你真的經受得了這種審視嗎? (虎嗅APP)