#大學寫作
紐約客:AI摧毀美國大學寫作的全景報告
科裡·羅賓是一位作家,也是布魯克林學院的政治學教授。他最初對有關 ChatGPT能力的報導持懷疑態度。後來,他當時上高二的女兒用它寫出了一篇論文,水平堪比他教的本科生花一個學期寫出的文章。他決定不再佈置帶回家的論文作業。在他三十年的教學生涯中,他第一次採用了課堂閉卷考試。自1865年開始,倫敦的計程車司機必須學習和通過世界聞名的"知識考試" 。該考試要求司機掌握查令十字車站六英里半徑範圍內、數千條街道和地標的詳細知識。研究發現,經過知識考試訓練的倫敦計程車司機,其大腦後海馬體(對長期記憶和空間感知至關重要)異常發達。這項考試至今依然存在。而顯然,自從有了GPS導航,人們也不再記憶地圖了。如今,有了AI,很多人已經不再記憶知識,甚至也不再思考了。這會讓我們失去什麼呢,除了發達的大腦後海馬體?人工智慧讓我們重新回到了那個問題:高等教育的意義究竟是什麼?十八歲之前,我們上學是因為必須如此,在學習第二次世界大戰和約分的同時,經歷著社會化的過程。我們基本上是在學習如何遵守規則。然而,大學是一種選擇,它一直包含著一個默契的協議:學生完成一系列任務,其中一些可能涉及他們認為毫無意義或不切實際的科目,然後獲得某種文憑。但即使對最功利的學生來說,追求分數或文憑也帶來了附帶的好處。你被教導如何做一件困難的事,或許在這個過程中,你開始欣賞學習的過程。但人工智慧的到來意味著,你現在可以完全繞開這個過程和其中的困難。紐約客剛剛發佈了一份長篇的報告文學,全景式地描述了美國大學生使用人工智慧的情景,以及由此引發的種種討論和思考。絕對值得細細讀完。What Happens After A.I. Destroys College Writing?The demise of the English paper will end a long intellectual tradition, but it’s also an opportunity to reëxamine the purpose of higher education.By Hua Hsu人工智慧摧毀大學寫作之後,將發生什麼?英語論文的消亡將終結一項悠久的學術傳統,但它也提供了一個重新審視高等教育目標的機會。關於究竟有多少學生在使用人工智慧,目前沒有可靠的資料,但各種故事都表明,人人都在用。一個風大的春日周四,期中考試剛過,我約了紐約大學的兩位本科生亞歷克斯和尤金一起吃麵,聊他們如何在學業中使用人工智慧。我去年第一次見到亞歷克斯時,他對藝術事業很感興趣,把大量業餘時間都花在和朋友們進行攝影創作上。但最近,他決定選擇一條更實際的道路:成為一名註冊會計師(C.P.A.)。他的周四總是很忙,四十五分鐘後還要參加一個會計課的學習小組。他把滑板收在餐廳的長凳下,從包裡拿出筆記型電腦,在我們坐下之前就連上了網。亞歷克斯留著一頭捲髮,說話帶著一種在灣區待久了的人特有的、輕鬆而富有韻律的腔調。他和尤金看著菜單,亞歷克斯建議點清湯而不是辣湯,“這樣我們都能好好護膚。”幾周前我給亞歷克斯發資訊時,他說他認識的每個人都在以某種方式使用 ChatGPT,但他自己只用它來整理筆記。可見面後,他承認這種說法根本不精準。“我生活中任何類型的寫作都會用人工智慧,”他說。他用 Claude 來做研究,用 DeepSeek 進行推理和解釋,用 Gemini 生成圖片。ChatGPT 則用來滿足更寬泛的需求。“我需要人工智慧來給女孩發簡訊,”他開玩笑說,想像著一個由人工智慧強化的 Hinge [譯註:一款約會軟體]。我問他我們約見面前,他是否也用了人工智慧。他笑了,然後回答說:“老實說,用了。我懶得打那麼多字。你看出來了沒?”OpenAI 於2022年11月30日發佈了 ChatGPT。六天後,其首席執行官山姆·阿爾特曼宣佈使用者數已達一百萬。像 ChatGPT 這樣的大語言模型並不會像人類那樣“思考”——當你向 ChatGPT 提問時,它會從訓練它的資料集中提取資訊,並根據可預測的詞語模式建構答案。多年來,許多公司都嘗試過由人工智慧驅動的聊天機器人,但大多在發佈後就失敗了;微軟在2016年嘗試推出的機器人 Tay,上線僅16小時就因開始發表種族主義言論和否認大屠殺而被關閉。但 ChatGPT 似乎不同。它能進行對話,並將複雜的概念分解成易於理解的步驟。不到一個月,Google的管理層就宣佈進入“紅色警報(code red)”狀態,他們擔心人工智慧會衝擊其搜尋引擎業務。教育工作者中則爆發了更大的恐慌。這個“作業殺手”的出現,讓學校在學期中途來不及制定出連貫的應對政策:ChatGPT 能在幾秒鐘內收集和總結研究資料,並起草一篇完整的論文。許多大型高校試圖監管 ChatGPT 及其後來的競爭對手,但大多徒勞無功。我請亞歷克斯給我看一篇由人工智慧生成的論文。尤金也想看。他用另一款人工智慧應用來幫助他完成商科課程的計算,但一直沒掌握用它來寫作的竅門。“沒問題,”亞歷克斯對他說。(文中所有學生的姓名均為化名。)他在筆記型電腦上打開了 Claude。我注意到一個聊天記錄裡提到了“廢奴運動(abolition)”。“我們有門課要讀羅伯特·韋德伯恩(Robert Wedderburn)的著作,”他解釋道,指的是十九世紀牙買加的廢奴主義者。“但很明顯,我才不想讀那個。”他讓 Claude 生成一份摘要,但摘要太長,他沒法在課前十分鐘內讀完。“我就對它說,‘把它變成簡潔的要點。’”然後他把 Claude 的要點抄在筆記本上,因為他的教授不允許在課堂上使用電子裝置。亞歷克斯找了一會兒,找到一篇藝術史課的論文,內容是關於一個博物館展覽。他去看過那個展覽,拍下了展品和附帶的牆上文字,然後上傳到 Claude,讓它按照教授的要求生成一篇論文。“我想儘可能少花力氣,因為這門課我實在不怎麼上心,”他說。他粗略讀了一遍論文,覺得人工智慧沒有充分回答教授的問題,於是他最佳化了提示語,讓它重寫一遍。最終,亞歷克斯提交的論文得到了相當於 A- 的成績。他說自己對論文的論點有個大概的瞭解,但如果教授問他具體細節,他肯定“就死定了。”我越過亞歷克斯的肩膀讀了那篇論文;它很好地模仿了一名本科生描述一組圖像的口吻。如果這是在2007年,我不會太在意它那平庸的語氣,或是那種精準地、按部就班完成任務式的評論。尤金嚴肅而略顯莊重,一直帶著一絲困惑在聽。“我可不敢像他那樣直接複製貼上,因為我疑心重得多,”他說。他比亞歷克斯小幾歲,ChatGPT 發佈時他還在上高中。那時,他曾嘗試用人工智慧寫論文,但發現它會犯一些容易被察覺的錯誤。“這篇論文通過了人工智慧檢測器嗎?”他問亞歷克斯。ChatGPT 剛推出時,教師們採取了各種措施來確保學生的作業是自己完成的。這些措施包括要求學生分享帶有時間戳的Google文件版本歷史,以及設計必須在課堂上分多次完成的書面作業。但大部分的“偵查”工作都在提交後進行。像 GPTZero、Copyleaks 和 Originality.ai 這樣的服務,會分析一篇文章的結構和句法,並評估其由機器生成的可能性。亞歷克斯說他的藝術史教授“年紀特別大”,所以可能不知道有這些程序。我們把這篇論文輸入到幾個不同的人工智慧檢測網站。一個網站說論文由人工智慧生成的可能性為28%;另一個則認為是61%。“比我預想的好,”尤金說。我問他是否認為他朋友的做法是作弊,亞歷克斯打斷道:“當然是了。你他媽開玩笑呢?”看著亞歷克斯的筆記型電腦,我注意到他最近還問過 ChatGPT 能否穿著耐克(Nike)的 Dunk 系列球鞋跑步。他得出的結論是,ChatGPT 是最好的知己。他像諮詢治療師一樣諮詢它,詢問約會技巧,以及如何在低谷期保持動力。他的 ChatGPT 側邊欄記錄了一個年輕人的喜怒哀樂。他向我和尤金承認,他申請紐約大學的文書就是用 ChatGPT 起草的——如果沒有人工智慧,我們今天的午餐可能根本不會發生。“我猜這確實很不誠實,但管他呢,反正我人已經在這兒了,”他說。“這算是作弊,但我覺得又不算那種意義上的作弊,”尤金說。他認為亞歷克斯的藝術史論文是一種沒有受害者的犯罪。他只是在滿足課程要求,又不是要成為一名文學學者。亞歷克斯得趕去參加學習小組了。我告訴尤金,我們的對話讓我開始反思自己作為一名教授的職能。他問我是不是教英語的,我點了點頭。“嗯,好吧,”他笑著說。“那你可真是受影響最大的了。”我在一所小型的文理學院(liberal-arts college)任教,我常開玩笑說,學生更有可能把一篇大論文拖欠一年再交(最近就發生了這樣的事),而不是走不光彩的捷徑。我的班級規模小而親密,教學由各種過程和教學模式驅動,比如刻意讓尷尬的沉默持續一會兒,這些都難以大規模複製。因此,我總隱約感覺我的學生學到了東西,即便這些收穫難以量化。過去,如果我擔心一篇論文有抄襲嫌疑,我會在搜尋引擎裡輸入幾句話,就算盡職調查了。但最近我開始注意到,一些學生的書面表達和他們在課堂上的口頭表達似乎不太同步。有一篇論文感覺像是兩個大腦拼湊出來的——一半行文流暢但刻板,另一半則親切自然、毫無修飾。由於從未明確過關於人工智慧的規定,我選擇了簡單的處理方式。那個學生至少還有羞恥心,自己寫了一半,我就把反饋集中在改進那一半上。我們很容易糾結於學術不端的個例。去年年底,一項針對學院和大學領導的調查顯示,59% 的人報告作弊現像有所增加,而如果你和學生們聊聊,會覺得這個數字還算保守。人工智慧讓我們重新回到了那個問題:高等教育的意義究竟是什麼?十八歲之前,我們上學是因為必須如此,在學習第二次世界大戰和約分的同時,經歷著社會化的過程。我們基本上是在學習如何遵守規則。然而,大學是一種選擇,它一直包含著一個默契的協議:學生完成一系列任務,其中一些可能涉及他們認為毫無意義或不切實際的科目,然後獲得某種文憑。但即使對最功利的學生來說,追求分數或文憑也帶來了附帶的好處。你被教導如何做一件困難的事,或許在這個過程中,你開始欣賞學習的過程。但人工智慧的到來意味著,你現在可以完全繞開這個過程和其中的困難。關於究竟有多少美國學生在使用人工智慧,目前沒有可靠的資料,但各種故事都表明,人人都在用。2024年皮尤研究中心(Pew Research Center)對13至17歲學生的一項調查顯示,目前有四分之一的青少年使用 ChatGPT 來完成學業,這個數字是2023年的兩倍。OpenAI 最近發佈的一份報告聲稱,有三分之一的大學生在使用其產品。我們有充分的理由相信,這些都是低估的數字。如果你是Google著一切長大,或用 Grammarly 來潤色文章,那麼將人工智慧視為又一個生產力工具也就不那麼離譜了。“我覺得它和Google沒什麼區別,”尤金說。“我用它的目的也差不多。”當學生就是要試探邊界,比規則快一步。當管理者和教育者們在為作弊爭論新定義、討論監控機制時,學生們早已在擁抱人工智慧的可能性。ChatGPT 發佈幾個月後,哈佛大學(Harvard)一名本科生獲准進行一項實驗,讓他用人工智慧完成了七門課程的論文。人工智慧輕鬆拿下了 3.57 的平均學分績點(G.P.A.),只比學校的平均水平略低一點。初創公司推出了專門將人工智慧生成的文字“人性化”的產品,TikTok 上的網紅也開始教導他們的粉絲如何避免被檢測出來。由於跟不上節奏,學術管理部門基本上放棄了控制學生使用人工智慧的努力,轉而採取一種充滿希望的無奈態度,鼓勵教師探索人工智慧在教學上的實際應用。在某些領域,這並不算什麼大的跨越。研究表明,人工智慧在幫助非英語母語者適應大學水平的英語寫作方面尤其有效。在一些 STEM [譯註:科學、技術、工程和數學] 課程中,使用生成式人工智慧作為工具是可以接受的。亞歷克斯和尤金告訴我,他們的會計學教授鼓勵他們利用各大公司為爭奪學生忠誠度而在春季推出的、僅限本科生享受的新人工智慧產品的免費優惠。今年五月,OpenAI 宣佈推出專為教育用途行銷的產品 ChatGPT Edu,此前牛津大學、亞利桑那州立大學和賓夕法尼亞大學沃頓商學院等學校已嘗試將人工智慧納入其課程。本月,該公司詳細介紹了將 ChatGPT 融入校園生活方方面面的計畫,學生們將獲得“個性化”的人工智慧帳戶,伴隨他們整個大學生涯。但對於英語系以及整個大學寫作而言,人工智慧的到來則更為棘手。現在還有什麼必要教寫作呢?與人工智慧帶來的更大問題,如其對環境的影響或工作自動化相比,期中論文的未來或許只是一個不值一提的煩惱。然而,在人類歷史上,寫作對普通人來說,何曾像今天這樣重要?電子郵件、簡訊、社交媒體帖子、評論區的憤怒長文、客戶服務聊天——更不用說我們實際的工作了。我們寫作的方式塑造了我們的思維。我們每天幾十次地通過組織文字來處理世界,這正是文學學者黛博拉·布蘭特(Deborah Brandt)所稱的我們的“大眾寫作”時代。在未來,當每個人都能使用相同的人工智慧助手時,寫出原創且有趣的句子的能力,或許只會變得更加重要。科裡·羅賓(Corey Robin)是一位作家,也是布魯克林學院的政治學教授。他最初對有關 ChatGPT 的報導持懷疑態度。後來,他當時上高二的女兒用它寫出了一篇論文,水平堪比他教的本科生花一個學期寫出的文章。他決定不再佈置帶回家的論文作業。在他三十年的教學生涯中,他第一次採用了課堂閉卷考試。羅賓告訴我,他覺得大學為應對人工智慧論文改採取的許多措施都是“毫無意義的保姆式做法”。他轉而信奉段落識別的藍皮書考試[譯註:藍皮書考試是一種傳統的紙筆閉卷考試,學生在藍色封面的考卷冊上作答。],即讓學生指出並分析課堂所讀文字的節選。“讀懂文字,並就此進行明智的書寫,”他說。“這是一種在不扮演警察角色的前提下,尊重他們自主性的方式。”他的女兒現在是高三學生,她抱怨說老師們很少佈置整本書的閱讀任務。羅賓也注意到,大學生們對節選比對整篇文章更適應,更喜歡短篇小說而非長篇小說。“我感覺他們不再具備那種我們過去佈置論文時所默認的文學或文化素養了,”他說。去年發表的一項研究發現,兩所中西部大學58%的學生在解讀查爾斯·狄更斯(Charles Dickens)的《荒涼山莊》(Bleak House)的開頭幾段時遇到了極大的困難,以至於“他們無法獨立閱讀這本小說”。而這些學生還是英語專業的。回歸紙筆是教授們應對人工智慧的普遍做法,過去兩年,某些大學的藍皮書銷量大幅上升。弗吉尼亞大學的媒體研究教授西瓦·維迪亞那坦在一些學生提交了他懷疑是人工智慧生成的作業後感到心灰意冷,而作業題目恰恰是關於學校的榮譽準則應如何看待人工智慧生成的作品。他也決定回歸藍皮書,並正在思考口試的可行性。“也許我們得一口氣退回到公元前450年,”他告訴我。但其他教授則重新強調讓學生看到過程的價值。加州大學戴維斯分校大一寫作項目主任丹·梅爾澤(Dan Melzer)回憶說,ChatGPT 剛問世時,“所有人都陷入了恐慌”。梅爾澤的工作是思考寫作如何在整個課程體系中發揮作用,以便所有學生,從未來的科學家到未來的律師,都有機會錘煉他們的文筆。因此,他對交流規範的變化,尤其是在網際網路時代的變化,持有一種包容的態度。他對那些認為某些作業枯燥機械而求助於 ChatGPT 以加快處理程序的孩子表示同情。他稱那種由引言、三個支撐段落和結論組成的經典“漢堡包結構”的五段式論文是“過時的”,源於精英主義傳統。梅爾澤認為,一些學生之所以厭惡寫作,是因為它的教學方式,尤其是在過去二十五年裡。《不讓一個孩子掉隊法案》(The No Child Left Behind Act)自2002年起在所有公立學校推行基於標準的改革,導致幾代學生被教導按照僵化的考試評分標準來寫作。正如一位教師在2013年《華盛頓郵報》上所寫,學生們在掌握了一種“糟糕寫作”形式後反而取得了優異成績。梅爾澤設計了一些工作坊,將寫作視為一個包含起草、反饋(來自同伴,也來自 ChatGPT)和修訂的審慎、迭代的過程。“如果你佈置一個泛泛的論文題目,不參與任何過程,一個月後直接收上來,那幾乎就像你在創造一個為犯罪量身定做的環境,”他說。“你這是在你的社區裡鼓勵犯罪!”我發現梅爾澤的教學方法很鼓舞人心;我立刻為自己經常把班級分成小組讓他們“研討”論文而感到內疚,彷彿這個動詞的意思是直觀明了的。但是,如果我是學生,我會覺得梅爾澤對過程的關注很乏味——這需要一定的信念,相信所有的努力最終都會有回報。寫作是困難的,無論它是一篇五段式論文還是一首俳句,而想要避免艱苦的工作是很自然的,尤其當你是一名大學生時——這就是為什麼像梅爾zer這樣的課程是必修的。“你可以想像學生們是多麼‘樂意’來上課,”他開玩笑說。上大學充滿了機會成本。看待人工智慧的一種方式是,它干預了人們選擇如何度過時間的方式。在二十世紀六十年代初,大學生估計每周花二十四小時在學業上。如今,這個數字大約是十五小時,這對當代高等教育的批評者來說,是年輕人受益於分數膨脹的標誌——在《哈佛深紅報》的一項調查中,近80%的2024屆畢業生報告其平均學分績點(G.P.A.)達到或超過3.7——並且他們缺乏前輩的勤奮。我不知道我在九十年代末上大學時花了多少小時在學業上,但我記得當時總感覺時間不夠用。我懷疑,即使今天的學生花在學習上的時間更少,他們感到的壓力也未必減輕多少。校園生活的本質就是每個人都融入一種忙碌文化,而很多焦慮已經轉移到了課外活動或職業預備追求上。哈佛大學的一位院長評論說,學生們感到必須在課堂外尋求卓越,因為他們在課堂內的表現大同小異。埃迪(Eddie)是長灘州立大學的一名社會學專業學生,比他大多數同學年齡都大。他2010年高中畢業,一邊全職工作,一邊上社區大學。“我為了上學經歷了很多,”他告訴我。“我想儘可能多地學習。”ChatGPT 是他的治療師推薦給他的,在長灘州立大學所屬的加州州立大學系統宣佈與 OpenAI 合作,為其四十六萬名學生提供 ChatGPT Edu 之前,它在長灘就已經無處不在了。“我當時對它的便利性有點懷疑,”埃迪說。“它似乎知道很多東西,那種方式看起來很像人。”他告訴我,他用人工智慧“作為頭腦風暴”,但從不直接用它來寫作。“我肯定會限制自己。”埃迪在洛杉磯縣工作,他是在休息時間和我交談的。他承認,當時間緊迫時,他有時會用 ChatGPT 來做測驗。“我不知道這是不是在自欺欺人,”他說。“我給了自己機會去做合乎道德的事,但如果我趕著去上班,我不會因此感到內疚,”特別是對於非專業的課程。我理解埃迪的矛盾。我用過幾次 ChatGPT,有一次它如此迅速地完成了一項日程安排任務,以至於我開始理解那種超高效率帶來的陶醉感。我感到需要阻止自己沉迷於漫無目的的提問。我過去幾個月採訪過的幾乎所有學生都描述了同樣的發展軌跡:從使用人工智慧輔助整理思路,到完全外包自己的思考。對一些人來說,它變得類似於社交媒體,總是在螢幕一角開著,一個分心的入口。這不像花錢請人代寫論文——沒有社交摩擦(social friction),沒有非法活動的光環。也不像分享筆記,或者把你在克里夫筆記(CliffsNotes)或 SparkNotes [譯註:均為文學作品學習輔導資料]上讀到的東西當作自己的分析。學生幾乎沒有時間去反思原創性或誠實性的問題——他們基本上成了一個項目經理(project manager)。而對於像埃迪那樣,把它當作一種交流和檢驗想法的工具的學生來說,並沒有一個清晰的界限來區分作品何時不再是原創思想。今年四月,Claude 背後的公司 Anthropic 發佈了一份報告,該報告基於一百萬份匿名的學生與其聊天機器人的對話。報告表明,超過一半的使用者互動可以被歸類為“協作式”,涉及學生與人工智慧之間的對話。(據推測,其餘的互動則更具“搾取性”。)梅是喬治城大學的一名大二學生,她最初對使用 ChatGPT 持牴觸態度。“我不知道這是否是出於道德考慮,”她說。“我只是覺得我能把作業做得更好,不值得為了節省那點時間。”但她開始用它來校對論文,然後生成求職信,現在她“幾乎所有”的課程都用它。“我不認為它讓我的寫作變差了,”她說。“也許它讓我成了一個更沒耐心的作者。我過去常常花好幾個小時寫論文,斟酌用詞,認真思考如何措辭。”大學讓她反思了自己在競爭極其激烈的高中時的經歷,在那裡她取得了頂尖的成績,但幾乎沒記住什麼知識。結果,她成了那種少有的覺得大學有點輕鬆的學生。ChatGPT 幫助她輕鬆完成繁瑣的作業,並加深了她對那些她真正充滿熱情的課程的投入。“我當時就在想,這些時間都去那兒了?”她說。直到她告訴我答案,我才第一次羨慕起一個大學生來:“我現在睡得更多了。”哈里·斯特科普洛斯負責愛荷華大學的英語系,該系有八百多名主修學生。在他的入門課程的第一天,他要求學生手寫一篇二百字的文章,分析拉爾夫·埃裡森(Ralph Ellison)的《看不見的人》(Invisible Man)的開篇段落。總會有一些抱怨聲,偶爾還會有學生走出教室。“我喜歡這個練習,因為它能定下基調,強調他們的寫作,”他告訴我。藍皮書考試的回歸可能會讓那些從小被鼓勵掌握打字的學生處於不利地位。一旦你習慣了打字的流暢節奏,再回到紙筆會感到束手束腳。但神經科學家發現,手寫的“具身體驗”能啟動大腦中打字無法觸及的部分。能夠用一種方式寫作——即使它更高效——並不會讓另一種方式過時。斯特科普洛斯的開學第一課練習帶有某種崇高的意味。但它還有另一個原因:手寫的段落也開啟了一條紙質記錄,證明了學生的語態和風格,助教在遇到可疑論文時可以查閱。凱文(Kevin)是雪城大學的一名大三學生,他回憶說,在一門課的第一天,教授讓每個人手寫一些想法。“那讓我會心一笑,”凱文說。“其他孩子都在抓耳撓腮,滿頭大汗,而我卻覺得,這挺不錯的。”凱文曾為一門大一新生適應校園生活的必修課擔任助教。他說,寫作作業涉及一些關於學生背景的基本問題,但他們常常還是用人工智慧。“我感到非常不安,”他說。他偶爾會用人工智慧來幫助他的高級阿拉伯語課程進行翻譯,但他現在看不起那些嚴重依賴它的人。“他們幾乎忘了自己有思考的能力,”他說。和許多曾經的抵制者一樣,凱文覺得他自己對人工智慧的審慎使用比同齡人的使用更具正當性。隨著 ChatGPT 的聲音越來越像人,我們是否會重新思考“聽起來像我們自己”意味著什麼?凱文和他的一些朋友以能聽出人工智慧生成的文字而自豪。他說,其標誌包括大量使用破折號和一種平淡客觀的語調。他的一位熟人把自己寫的論文輸入檢測器,因為她擔心自己的措辭開始像 ChatGPT 了。他讀了她的論文:“我意識到,是的,聽起來確實有點像 ChatGPT。這讓我有點害怕。”ChatGPT 一個特別讓人卸下防備的方面是,如果你指出一個錯誤,它會用一種懊悔學生般的、退縮的語氣進行交流。(“為之前的混淆表示歉意……”)它的錯誤常被稱為“幻覺(hallucinations)”,這個描述似乎將人工智慧擬人化,讓人聯想到一個睡眠不足的助手。一些教授告訴我,他們讓學生去核查 ChatGPT 的工作,以此來討論原創研究的重要性,並展示機器的不可靠性。大多數人工智慧的幻覺率都在惡化,且沒有單一的原因可以解釋這種增長。正如一位研究員告訴《紐約時報》:“我們仍然不清楚這些模型到底是如何工作的。”但許多學生聲稱對人工智慧的錯誤並不在意。他們對成就問題顯得漠不關心,甚至與自己的作品脫節,因為它只是名義上屬於他們。約瑟夫(Joseph)是十大聯盟(Big Ten)學校的一名一級聯賽運動員,他告訴我,他認為在課程中使用 ChatGPT 沒問題,但他有一個例外:他想“真實地”體驗他的非洲文學課程,因為它涉及他的文化遺產。紐約大學的學生亞歷克斯說,如果他的一篇人工智慧論文得了不好的成績,他的失望會集中在他為訂閱服務花了二十美元這個事實上。奧古斯特是哥倫比亞大學電腦科學專業的大二學生,她告訴我有一門課要求她就自選主題寫一篇簡短的講稿。“那是一門每個人都保證能得 A 的課,所以我就把它放進去了,可能就改了兩三個詞就交了,”她說。她的教授將她的文章評為優秀作品,並要求她在一堂二百人的課上朗讀。“我有點緊張,”她說。但她隨即意識到,“如果他們不喜歡,反正也不是我寫的,你懂嗎?”相比之下,凱文渴望的是一種更普遍的道德優越感。我問他,如果他的一篇論文得分比用了 ChatGPT 的同學低,他是否會感到困擾。“一方面,我能夠進行區隔,不為此生氣,”他說。“我作為一個‘人’得到了成長。我可以對此有一種優越感。我學到了更多。”他笑了笑。但他接著說,“另一方面,我也會覺得,這太不公平了。我本可以多和朋友們出去玩的。我得到了什麼?我只是讓自己的生活在那段時間裡更艱難了。”在我的交談中,正如大學生們無一例外地將 ChatGPT 僅僅視為又一個工具一樣,四十歲以上的人則專注於它的影響,將其與 GPS 導致我們與空間關係退化相提並論。那些經過嚴格“知識(the knowledge)”[譯註:“The Knowledge” 指倫敦計程車司機必須通過的嚴格考試,要求他們熟記城市中數千條街道和地標。]訓練的倫敦計程車司機,其大腦後海馬體(對長期記憶和空間感知至關重要)異常發達是出了名的。然而,最終,大多數人可能寧願選擇更快捷的出行,而不是更敏銳的記憶。什麼是值得保留的,我們又願意為了效率而外包什麼?如果我們認真對待人工智慧輔助可以加速學習這個想法呢?——即今天的學生能更快地到達目的地。2023年,哈佛大學的研究人員在一門熱門物理課程中,引入了一位自定進度的(self-paced)人工智慧導師。使用人工智慧導師的學生報告了更高的參與度和積極性,並且在一項測試中的表現優於那些由教授授課的學生。喬治城大學的學生梅告訴我,她在為考試複習時,經常讓 ChatGPT 生成額外的練習題。人工智慧的出現,難道不是為了摧毀教育,而是為了革新它?巴裡·林(Barry Lam)在加州大學河濱分校的哲學系任教,並主持一個熱門播客《Hi-Phi Nation》,該播客將哲學探究模式應用於日常話題。他開始思考,如果人工智慧真的成為一種生產力工具,那意味著什麼。他在自家小屋裡搭建的播客錄音室裡和我交談。“現在學生們能在三十秒內生成我過去需要一周才能完成的東西,”他說。他將教育比作木工,這是他的眾多愛好之一。你能在沒學會手鋸的情況下,直接跳到使用電動工具嗎?如果學生們學得更快了,那麼林就有理由給他們佈置“一些非常難的”作業。他想檢驗這個理論,於是在期末考試中,他給了本科生一個博士等級的問題,涉及指稱語言德國邏輯學家戈特洛布·弗雷格(Gottlob Frege),坦白說,這已經超出了我的理解範圍。“他們考得一塌糊塗,”他說。他相應地調整了評分曲線。林並不覺得使用人工智慧在道德上站不住腳。“它不是複製貼上意義上的抄襲,”他爭辯說,因為嚴格來說沒有原始版本。相反,他覺得這可能是對大家時間的浪費。在學期初,他告訴學生:“如果你們只想交一篇 ChatGPT 生成的論文,那我就用 ChatGPT 來給你們所有的作業打分,然後我們都可以去海灘了。”沒有人是因為喜歡批改論文才去當老師的。我與一位教授交談,他熱情洋溢地談到,自從他用簡短的考試取代了論文後,他的學生學到了更多東西。我問他是否懷念批改論文的日子。他笑了笑說:“無可奉告。”東北大學的一名本科生最近指控一位教授使用人工智慧來建立課程材料;她向學校提出了正式投訴,要求退還部分學費。這場風波暴露了許多人上大學的原因與教授教學的原因之間的緊張關係。學生們從小被教導將成就理解為具體可衡量的事物,但當他們進入大學,卻遇到像我這樣的人,懇求他們與困難和抽象搏鬥。更糟糕的是,他們被告知,分數不像他們努力考大學時那麼重要了——只是到這個時候,學生們的思維模式已經被設定為尋找通往好成績的最有效路徑。隨著寫作這門手藝被人工智慧所貶低,原創寫作已成為訓練語言模型的寶貴資源。今年早些時候,一家名為“催化劑研究聯盟”(Catalyst Research Alliance)的公司刊登廣告,尋求上世紀九十年代末和本世紀頭十年中期在密歇根大學進行的兩項研究中的“學術演講資料和學生論文”。學校要求該公司停止其工作——這些資料本就免費提供給學者——一位大學發言人表示,學生資料“過去不是,也從未被出售過”。但這種情況確實讓許多人開始思考,教育機構是否會開始將原創學生作品視為潛在的收入來源。根據經濟合作與發展組織最近的一項研究,自2012年以來,人類的智力水平有所下降。一項針對近三十個國家數萬名成年人的評估顯示,在數學和閱讀理解方面的測試分數出現了長達十年的全面下降。經合組織教育與技能司司長安德烈亞斯·施萊歇爾(Andreas Schleicher)推測,我們今天消費資訊的方式——通常是通過簡短的社交媒體帖子——與識字能力的下降有關。(在該評估中,歐洲表現最好的國家之一是愛沙尼亞,該國最近宣佈將在未來幾年內向一些高中生推廣人工智慧,將書面論文和死記硬背的家庭作業邊緣化,轉而支援自主學習和口試。)哲學教授林曾是我的同事,我們還曾短暫地做過鄰居。我偶爾會從窗外看到他在修籬笆或打理花園。他是一位狂熱的業餘廚師、吉他手和木匠,並且他堅信,學習用那種煩人、老派、且如他所說的“匠人式(artisanal)”的方式做事是有價值的。他告訴我,他的妻子珊娜·安德拉維斯(Shanna Andrawis)——自2008年以來一直是一名高中教師——經常不同意他對付大型語言模型的輕率方法。安德拉維斯認為,不誠實一直是個問題。“我們正在嘗試進行大規模教育,”她說,這意味著沒有太多空間去講究教學過程的精細。“我不會和學生討論‘匠人式’寫作。但我會和他們討論我們之間的關係。尊重我,給我你真實的聲音,即使你覺得它不那麼好。沒關係。我想在你所在的地方與你相遇。”歸根結底,與 ChatGPT 相比,安德拉維斯更擔心的是當今年輕人所處的更廣泛的環境。她的學生變得越來越內向,盯著手機,沒什麼意願去“練習克服那種”定義了青少年生活的“尷尬”,如她所說。人工智慧可能會加劇這種惡化,但它並非罪魁禍首。它只是“在一份已經很難吃的冰淇淋聖代上,又加了一顆小櫻桃,”她說。學年開始時,我對 ChatGPT 的感覺介於失望和鄙夷之間,主要針對學生。但隨著時間的推移,我對應該怎麼做以及誰是罪魁禍首的看法變得越來越模糊。取消核心必修課、反思平均學分績點(G.P.A.)、教授對人工智慧的批判性思維,這些潛在的解決方案都無法逆轉美國年輕一代成長的先決條件。教授們可以重新構想課堂,但我們能控制的只有這麼多。我缺乏信心,不相信教育機構會把新技術僅僅看作是不可避免的事物之外的任何東西。學院和大學,其中許多就在幾個學期前還試圖限制人工智慧的使用,現在卻爭相與 OpenAI 和 Anthropic 這樣的公司合作,將一個四年前還不存在的產品視為學校未來的必需品。除了在家鄉閒逛了一年,我基本上過去三十年都在校園裡度過。如今的學生以消費者的眼光看待大學,其方式是我在他們這個年紀時從未想過的。他們成長於一個重視高速觀點而非批判性思維的緩慢審思的時代。儘管我同情學生們的各種小煩惱,但我很少將自己投射到他們的生活中。我注意到他們在互相觀察,然後任由他們生活的謎團隨風而去。他們承受的壓力與我作為學生時感受到的截然不同。儘管我羨慕他們的新陳代謝,但我絕不希望擁有他們那種對未來的視野。教育,尤其是在人文學科,建立在一種信念之上:除了學生可能記住的實用知識外,某個不經意間提到的晦澀想法可能會在他們心中紮根,並在未來幾年後開花結果。人工智慧能讓任何人感覺自己像個專家,但正是風險、懷疑和失敗讓我們成為人類。我常告訴我的學生,這是他們人生中最後一次有人必須閱讀他們所寫的東西,所以他們不妨告訴我他們真實的想法。儘管當前對學生作弊的恐慌沸沸揚揚,但他們並不是該被指責的人。他們沒有在小學時遊說引入筆記型電腦,疫情期間不得不在 Zoom 上課也不是他們的錯。他們沒有創造人工智慧工具,也不是吹捧技術創新的急先鋒。他們只是早期使用者,試圖在一個從未如此容易的時代裡,智勝這個系統。而且他們和我們其他人一樣,無法控制這一切。也許他們比我更敏銳地感覺到這種無力感。前一刻,他們被告知要去學程式設計;下一刻,事實證明僱主在尋找的是那種可能從英語或哲學專業學到的“軟技能”。今年二月,紐約聯準會的一份勞工報告指出,電腦科學專業的失業率高於民族研究專業的——一些人認為,這是人工智慧將入門級程式設計工作自動化的結果。我交談過的學生中,沒有一個看起來是懶惰或被動的。紐約大學的學生亞歷克斯和尤金很努力——但他們的一部分努力花在了剔除大學經歷中任何他們覺得多餘的東西上。他們極度善於利用資源。課程結束,學生們搬進暑期宿舍時,我和在東村安頓下來的亞歷克斯通了郵件。他剛考完期末,估計他花在寫兩篇人文學科論文上的時間在三十分鐘到一小時之間。如果沒有 Claude 的幫助,這可能要花上他八到九個小時。 (不懂經)