AlphaGo勝局十年後:AI正在重塑職業棋手的思維方式

在首爾東部寧靜的弘益洞小巷深處,有一棟貼著褪色石磚的建築,門牌上寫著“韓國棋院"——這是韓國職業圍棋的管理機構。

圍棋是一項古老的運動,在韓國有著神聖的地位。然而走進這棟樓,昔日棋手將手伸入木碗取子時發出的細微聲響,如今已被滑鼠點選聲所取代:棋手們弓身坐在顯示器前,在 AI 程序中復盤對局;另一些人圍坐在棋盤旁,爭論下一步最優落點,而教練則告知他們的選擇與 AI 的建議相差多少;還有人默默坐著,看 AI 程序與 AI 程序對弈。

十年前,Google DeepMind 的 AI 程序 AlphaGo 擊敗韓國棋手李世石(Lee Sedol),震驚世界。此後數年,AI 徹底顛覆了這項運動,推翻了數百年來關於最優落子的原則,並引入了全新的思路。棋手們如今訓練的目標,是儘可能地複製 AI 的落子,而非創造自己的風格,那怕他們對機器的思維邏輯仍感到茫然。

(來源:麻省理工科技評論)

今天,不借助 AI,棋手幾乎不可能在職業舞台上立足。有人說這項技術耗盡了圍棋的創造力,也有人認為人類的創造空間依然存在;與此同時,AI 正在推動訓練資源的民主化,越來越多的女棋手因此得以躋身高段行列。

對於世界頂尖棋手申真諝(Shin Jin-seo)而言,AI 是一位不可或缺的訓練夥伴。每天清晨,他坐在電腦前打開 KataGo。他因落子風格與 AI 高度契合而被冠以“申真智能”的外號,他追蹤那個代表程序最優建議的藍色光點,在數字棋盤上不斷調整棋子位置,試圖理解機器的思考邏輯。“我一直在思考 AI 為什麼會選擇這步棋,”他說。

備戰對局時,申真諝將大部分清醒時間都花在研讀 KataGo 上。“這幾乎像一種修行,”他說。2022 年韓國棋院聯賽的一項研究顯示,申真諝的落子與 AI 建議的吻合度達 37.5%,遠高於研究中所有棋手的平均水平 28.5%。

“我的棋風變了很多,”申真諝說,“因為我必須在一定程度上遵從 AI 的指引。”韓國棋院表示,已主動聯絡 Google DeepMind,希望促成申真諝與 AlphaGo 之間的對局,以紀念 AlphaGo 擊敗李世石十周年。Google DeepMind 發言人表示,公司目前暫無相關資訊可以披露。但若新的對局成真,在更先進 AI 程序上磨礪多年的申真諝對獲勝持樂觀態度。“AlphaGo 當時仍有一些弱點,我認為針對這些弱點可以擊敗它,”他說。

規則

圍棋是一種抽象策略棋類遊戲,起源於 2500 多年前的中國。兩位棋手輪流在 19×19 的棋盤上落下黑白棋子,通過包圍對手的棋子來佔領領地。這是一場令人歎為觀止的數學複雜遊戲。棋盤可能的局面數約為 10 的 170 次方,遠超宇宙中的原子數量。如果說國際象棋是一場戰鬥,圍棋便是一場戰爭:你在一角窒息對手的同時,還要在另一角抵禦入侵。

為訓練 AI 下圍棋,海量人類棋局資料被輸入模擬人腦神經元網路的計算系統神經網路。AlphaGo 在擊敗李世石後被命名為 AlphaGo Lee,訓練封包含 3000 萬步棋局,並通過與自身進行數百萬次對弈加以精進。2017 年,其繼任者 AlphaGo Zero 從零開始學習圍棋,不研究任何人類棋局,僅依據規則與自身對弈,純靠自我博弈發展出落子策略。這種白板式學習方式不受人類知識侷限,被證明更為強大。訓練三天後,AlphaGo Zero 以 100 比 0 完勝 AlphaGo Lee。

Google DeepMind 同年宣佈 AlphaGo 退役。隨後,一批受 AlphaGo Zero 啟發的開源模型相繼湧現。今天,KataGo 是韓國職業圍棋棋手使用最為廣泛的程序。它比 AlphaGo 更快、更精準,不僅能預測勝負,還能在任意時刻預測棋盤每個點位的歸屬。AlphaGo Zero 通過分析棋盤的局部小塊來拼湊出對整體的理解,而 KataGo 則學會了讀懂整張棋盤,對長遠戰略形成了更強的判斷力。它不僅學會了如何贏棋,更學會了如何最大化得分。

這款軟體從根本上改變了人們的下棋方式。數百年來,職業棋手應對圍棋天文數字般複雜局面的方式,是發展出一套替代純粹計算的啟髮式原則:精妙的佈局策略為空白棋盤建立抽象秩序,早早搶佔角落被視為劃不來的交換,每一代棋手都在積累新的原則,充實這門學問的體系。

然而,“AI 改變了一切,”韓國圍棋解說員朴正相(Park Jeong-sang)說,“曾經被視為常識的基本下法如今幾乎銷聲匿跡,而過去從未有過的技術則大行其道。”

變化最為顯著的是佈局。圍棋從空白棋盤開始,前 50 手曾是抽象思考與創造力的畫布,棋手在其中刻下各自的個性與棋道哲學。李世石以充滿挑釁的落子風格著稱,擅長製造混亂;曾在 2017 年負於 AlphaGo Master 的中國棋手柯潔,則以靈動想像力令人眼花繚亂。如今,棋手們記憶的是同一套由 AI 建議的高效、精算型佈局套路。棋局的重心已轉移到中盤,在那裡,純粹的計算能力比創造力更為重要。

AI 訓練導致了棋風的同質化。柯潔曾感嘆,看著同樣的佈局套路被無休止地重複,令人疲憊。“我和場下的觀眾感受完全一樣,看著很累,很痛苦,”他 2021 年在接受中國媒體採訪時說。每當有棋手突破慣例、落出出人意料的棋,觀眾便歡呼雀躍,但這樣的時刻已越來越少。2023 年的一項研究顯示,頂尖圍棋棋手超過三分之一的落子與 AI 建議相同。許多棋手表示,每局棋的前 50 手往往與 AI 的建議如出一轍。

“圍棋已經變成了一項智力競技運動,”在 2016 年負於 AlphaGo 三年後退役的李世石說,“在 AI 出現之前,我們追求的是更高的東西。我是把圍棋當作一門藝術來學的,”他說,“但如果你的落子來自抄答案,那就不再是藝術了。”

一些棋手說,下圍棋不再是開拓新領域,而是遵從一個超人神諭的指令。“我曾經通過推動圍棋技術的進步、呈現新的範式來激勵棋迷,”李世石說,“我下棋的理由已經消失了。”

棋思

留守賽場的棋手們正在嘗試重建自己的技藝,但很難辨清新的原則究竟是什麼。

金彩瑛(Kim Chae-young)是世界頂尖女棋手之一,恬靜沉穩,從職業棋手父親那裡習得了這門技藝。然而當 AI 開始重塑圍棋,她發現自己不得不從頭來過。“我需要時間去拋棄自己以前學到的一切,”金彩瑛在與我共享螢幕、用游標指著 KataGo 建議的藍色點位時說,“多年來積累的直覺,原來是錯的。”

她湊近顯示器,螢幕上顯示著每一步棋的勝率,沒有任何解釋。即便是金彩瑛、申真諝這樣的頂尖棋手,也無法理解 AI 的所有落子。“它好像是在用更高維度的方式思考,”她說。當她試圖向 AI 學習時,她補充道,“與其說是理性地推敲每一步棋,不如說是在培養一種直覺。”

研究人員正努力破譯棋類 AI 程序中編碼的超人知識,以便人類也能從中學習。2024 年,Google DeepMind 的研究人員從 AlphaZero(AlphaGo Zero 的通用版本,同樣能夠下國際象棋)中提取出新的象棋概念,並通過象棋題將其傳授給國際象棋大師。棋手們迄今從 AI 系統中汲取的圍棋概念,“很可能只是你潛在可以學到的一小部分,”豐田工業大學芝加哥分校電腦科學家尼古拉斯·托姆林(Nicholas Tomlin)說,他是一項探究 AlphaGo Zero 中圍棋概念編碼的研究的共同作者。

然而提取這些經驗依然困難重重。“頂尖棋手至今仍未能歸納出 AI 落子背後的一般性原則,”明知大學圍棋教授南志賢(Nam Chi-hyung)說。儘管棋手可以模仿 AI 的落子,但由於其推理過程如同黑箱,他們尚未從中提煉出圍棋新的範式。圍棋或許正處於一種認識論上的迷途之中。

即便 AI 是一位深不可測的導師,它也是一位公平的導師。AI 極大地提升了女棋手的訓練條件,而這一群體長期以來在圍棋界處於弱勢地位。南志賢表示,數十年來,圍棋訓練意味著在頂尖男棋手門下學藝,最具競爭力的對局也集中在女棋手難以涉足的男性圈子裡。“女棋手從未有過那樣的歷練機會,”她說,“但現在她們可以跟 AI 學習,訓練環境大為改善。”從更宏觀的角度來看,AI 通過幫助所有棋手打磨佈局套路,縮小了棋手之間的差距。

近年來,女棋手的排名持續攀升。2022 年,時任世界女子第一人的崔精(Choi Jeong)成為首位晉級國際大賽決賽的女棋手。她以凶悍好鬥的棋風被稱為“女子力士”,在決賽中迎戰申真諝,最終落敗,但這場對決為圍棋界女棋手開創了先例。2024 年,金彩瑛因在韓國圍棋聯賽後季賽奪冠而登上新聞頭條,她是那屆賽事中唯一的女棋手。

AI 訓練賦予了金彩瑛全新的自信。用 AI 分析男棋手的對局,打破了他們看似無懈可擊的光環。“以前,我無法判斷頂尖男棋手的實力究竟有多強,他們感覺無堅不摧。現在,我知道他們也會犯錯,他們的落子並非總是妙手,”她說,“AI 打破了心理上的壁壘。”

身份

儘管 AI 在圍棋上的造詣已遠超任何棋手,棋迷們依然更願意觀看人與人之間的對局。“AI 程序之間的對弈,對棋迷來說並不好看,”解說員朴正相說,這類對局過於複雜,棋迷難以跟上,而且太過完美,缺乏緊張感。

棋手可以複製 AI 的佈局套路,但到了中盤,棋盤演變出多到無法全部記憶的可能性,便需要依靠自己的判斷。棋迷樂於看到棋手犯錯、逆境翻盤,在棋盤上每一顆棋子裡流露個性。申真諝的棋風強硬好鬥,卻帶著一種機械般的沉著;金彩瑛則善於在最混亂的局面中遊刃有餘。

“圍棋裡,每一步都是你自己的選擇,對手也用自己的選擇來回應,”27 歲的圍棋愛好者和業餘棋手金大熙(Kim Dae-hui)說,“看著這個過程展開,很有意思。”

有金大熙這樣的棋迷在看,申真諝從自己的棋局中找到了意義。“我能下出一種只有人類才能講述的故事,”他說。

退役後,李世石尋找一份能發揮人類優勢的新工作,開始製作桌游、巡迴演講,並在大學教學生下棋。“我在尋找一個我能享受、能擅長的新領域,”他說。

然而近來,他對自己離開的那項運動重燃了希望。“下出一局完美棋局,是每一位圍棋棋手的夢想,”那是一局技藝精湛、沒有失誤、勢均力敵的棋手廝殺至刀刃邊緣的對局。“這就像一個海市蜃樓,”李世石笑著說,“也許 AI 能幫我們下出那樣一局完美的棋。”

申真諝希望自己能做到這一點。對申真諝來說,AI 是老師、是夥伴、也是引路的北極星。“我或許是當今最強的人類棋手之一,但有 AI 在,我不能自滿,”他說,“AI 給了我繼續進步的理由。” (麻省理工科技評論APP)