Google-C和Google-A周一股價再創歷史新高!大漲超6%!市值逼近4兆美元!大機率將成為全球第3家市值超越4兆美元的公司。Google在11月份逆勢上漲,成為M7里唯一逆風飛揚的公司,成為全球AI新的風向標。
如果你把時間撥回到 2022 年底,很難想像今天的 Google。
那時候,它是一個被 ChatGPT 打懵的巨頭:手裡握著 Transformer、LaMDA 這些一代又一代的基礎發明,卻看著 OpenAI 把大模型第一次做成了真正意義上的大眾產品——使用者在 ChatGPT 上瘋狂湧入、華爾街情緒劇烈搖擺、Alphabet 股價一年之內跌去近四成。
這一篇,不是在給 Google 做“事後諸葛式”的勝利總結,而是把這兩年拆開來,看看一家巨頭在被迫加速時,究竟犧牲了什麼、學到了什麼,又賭上了什麼。
《WIRED》採訪了 50 多位現任和前任 Googler,從寫底層模型的工程師,到天天和監管、風險對線的法務與安全團隊,再到坐在董事會門口做路演的高管。
從結果看,過去兩年當然有值得寫進“成功史”的橋段。
Gemini 3 代表的是 Google 在技術正面戰場上的一次翻身仗:不再滿足於“我們也有大模型”,而是在多模態、推理、Agent 這些真正決定下一階段競爭格局的維度上,把能刷的榜單幾乎刷了個遍,讓外界第一次認真承認——Google 不是完全被 OpenAI 甩在身後。
但如果只盯著這些亮點,很容易忽略一個更不體面的事實:這些“成功”是踩著一連串極度狼狽的翻車、內部撕扯和文化反轉堆出來的。
Bard 為了搶在 Bing 之前露面,提前一天放出“望遠鏡示例”,結果一個事實性錯誤就砸掉上百億美元市值;Gemini 圖像生成在人物與種族上翻車,讓“覺醒 AI”成為攻擊標籤;AI Overviews 把“每天吃一塊石頭”“往披薩裡加膠水”這樣的玩笑帖當成嚴肅答案展示在搜尋結果最醒目的位置。
過去那個以“可靠資訊”“搜尋質量”立身的 Google,一度真的在內部被員工罵成了“fabrication machine”的製造者。
而更深一層的衝突,在於價值觀與商業現實的正面撞車。為了追 OpenAI 的節奏,Google 壓縮了負責任 AI 的稽核流程,把原本要花幾個月做偏見與安全測試的工作,硬塞進一兩個月甚至更短的窗口。
這篇文章要做的,是把這兩年拆成一塊一塊具體的場景:
Sissie Hsiao 如何在“一百天”的倒計時裡拼出 Bard;
DeepMind 和 Brain 是在怎樣的氣氛下被合併成 Google DeepMind;
Gemini 3 的性能反攻、Nano Banana 的端側落地,背後動用了那些看不見的籌碼;
以及在望遠鏡烏龍、圖像風波、披薩膠水這些“笑話”裡,Google 是怎樣一步步下調自己的風險標準、重寫內部對“可接受錯誤”的定義。
以下是全文翻譯。
一百天——這就是當時 Google 給 Sissie Hsiao 的時間:一百天,造出一個能對抗 ChatGPT 的產品。
到 2022 年 12 月接下這項任務時,Hsiao 已經在 Google 工作了 16 年多,管理著上千名員工。她見過不少公司層面的“危機時刻”,但從來沒有一場像這次“紅色警報”——自從一家名不見經傳的研究機構 OpenAI 放出那個面向公眾的 AI 實驗產品之後,整個局勢變了。儘管 ChatGPT 經常一本正經地胡說八道、連簡單數學都會算錯,但已經有一百多萬使用者在用了。更糟的是,有些人開始把它當作 Google 搜尋的替代品——而搜尋正是這家公司最賺錢的現金牛。
其實,Google 手裡早就有一個幾乎不輸 OpenAI 的語言模型,但一直被拴得很緊。公眾想跟 LaMDA 聊天只能拿到“邀請制”資格——而且在對外演示中,它最多也就是聊聊“狗”。
華爾街開始不安。早在六年多前,CEO Sundar Pichai 就放出豪言:要為一個“AI 優先”的世界做準備,在那個世界裡,“智能助手”會取代“裝置”本身的概念。緊接著,Google 自己的八位研究員發明了 Transformer 架構,也就是 ChatGPT 裡那個“T”的字面來源。可這些年 Google 拿得出手的是什麼?令人失望的廣告收入,一路延伸的“Transformer 之父”們的離職名單,還有一個叫 Assistant 的產品——也就是 Hsiao 管的那個——在現實裡的主要用途就是設鬧鐘、放歌。再加上一款為了 Gen Z 打造的“半成品聊天機器人”,給人講菜譜和歷史小知識。到 2022 年底,Google 母公司 Alphabet 的股價,相比上一年年末已經跌了 39%。
到了 2023 年年初,Google 高管幾乎要時時刻刻向董事會匯報進展。坐擁遊艇的 Google 聯合創始人之一、同時也是公司控股股東的 Sergey Brin 重新出現在內部會議上,審視 AI 戰略。公司向員工傳達的訊號是:這家市值兆美金的巨頭,必須以接近創業公司的速度行動。這意味著要承擔更大的風險。Google 將不再是那種“幾千個人可以否決一個產品,但沒有任何一個人能真正拍板上馬”的地方——一位前高級產品總監後來對《WIRED》說。Hsiao 的團隊開始了那場 100 天衝刺,她提出了一個“有點怪”的要求:“質量優先於速度,但也要快。”
與此同時,另一位高管 James Manyika 則在參與高層討論的過程中,推動一場更長期的戰略調整。Manyika 受過牛津機器人學訓練,後來做了多年麥肯錫顧問,給矽谷大佬們出謀劃策。2022 年初,他加入 Google,擔任“技術與社會”高級副總裁。在 ChatGPT 公開之前的幾個月裡,他曾經對老朋友 Pichai 說過,Google 在 AI 上的猶豫不決只會拖累自己。公司內部有兩支世界級 AI 研究團隊,卻各自為戰、在不同方向上消耗著寶貴的算力——倫敦的 DeepMind,由 Demis Hassabis 負責;以及位於山景城、隸屬於 Jeff Dean 的 Google Brain。Manyika 當時就對 Pichai 說:這兩支團隊應該合起來幹一件事。
在 OpenAI 發佈 ChatGPT 之後,這件事終於發生了。Dean、Hassabis 和 Manyika 一起去董事會上匯報:把兩邊的團隊聯合起來,造出有史以來最強的語言模型。Hassabis 想給這個項目取名 Titan,但董事會明顯不太喜歡。最後採用的是 Dean 的提議——Gemini。(有一位激動的億萬富翁投資人當場給這三位高管拍了合影留念。)
從那之後,Manyika 說,整個公司內部出現了很多他稱之為“大膽而負責”的決策。他又補了一句:“我也不確定我們每一次都做對了。”事實上,這場要把 Google 拉回 AI 領跑位置的競賽,很快就把公司推入一波又一波新的危機裡:有一度,員工會在走廊上聚在一起,小聲擔心 Google 會不會成為下一個 Yahoo。“就像在用衝刺的速度跑馬拉松,”Hsiao 形容道。可如今,兩年多過去了,Alphabet 的股價已經漲到歷史新高,投資人重新對它在 AI 上的進展充滿信心。
為了打造這個新的 ChatGPT 對手——代號 Bard,前員工回憶說,Hsiao 從 Google 各個團隊直接“抽走”了大約 100 個人。根據一位前搜尋團隊員工的說法,各組經理根本沒有拒絕的權力:Bard 優先順序高於一切。Hsiao 說,她優先挑選的是那些既能看大局、又有硬技術能力,還要有情緒管理和合作能力的人——因為這是一個小團隊,需要成員在任何需要的地方都能頂上去。大多數團隊成員都在加州山景城辦公,他們得足夠靈活,也得願意“什麼帽子都戴”。“你們就是 Bard 團隊,”Hsiao 對他們說,“所有角色都得你們自己承擔。”
2023 年 1 月,Pichai 宣佈了 Google 歷史上的第一次大規模裁員——裁掉 12,000 人,佔總員工數的大約 7%。“當時完全沒有人知道,接下去要怎麼做才算是‘安全’,”一位前工程經理說。一些員工擔心,如果不主動加班,很快就會被裁掉。如果這意味著要打亂陪孩子睡覺的時間,為了參加 Bard 團隊深夜的會議,那就只能妥協。
Hsiao 和她的團隊需要整個公司的巨大支援。他們可以基於 LaMDA 來建構產品,但必須更新它的知識庫,並加入新的安全保護機制。Google 的基礎設施團隊把頂尖的人手都調去,專門幫 Bard 騰伺服器、做模型微調。某些資料中心的用電量幾乎被推到極限,已經逼近會燒壞裝置的風險。基礎設施團隊還不得不飛快設計新的調度工具,去更安全地應對不斷攀升的電力需求。為了緩解緊張的氣氛,有人給 Hsiao 團隊訂製了一批鐳射籌碼,上面印著某款 Google 晶片的代號,像撲克籌碼一樣堆了一桌,擺在一位工程領導的辦公桌上,對他說:“你的晶片在這兒。”
然而,即便新增的算力在最初幾周陸續上線,工程師們仍然一次又一次撞上此前 Google 在生成式 AI 項目中反覆遇到的問題——而這些問題,按過去的節奏,很可能會讓高管選擇“放慢腳步”。和 ChatGPT 一樣,Bard 會“幻覺”,會給出不合時宜甚至冒犯性的回覆。一位前員工說,早期原型會“滑向一些滑稽到誇張的種族刻板印象”。只要問任何一個聽起來像印度人名字的人的簡歷,它就會把對方描述成“寶萊塢演員”;聽起來是中國男性名字?那基本一律是“電腦科學家”。另一位前員工則說,Bard 的輸出雖然不至於危險——“就是很蠢”。
有些人會螢幕擷圖分享它最離譜的回應用來調侃。“我讓它模仿 Three 6 Mafia 的風格,寫一首往海裡扔汽車電瓶的說唱,它居然非常具體地寫到要把人綁在電瓶上,這樣他們會下沉淹死。”那位前員工說,“我原本的提問里根本沒有提到謀殺。”
在自定的 100 天期限下,Google 能做的只有一個:在時間用完之前,儘可能多地發現和修補這些“翻車點”。一些原本負責稽核兒童虐待影像等問題的承包稽核員被調去大規模測試 Bard,而 Pichai 則號召只要有空的員工都去幫忙。最終,有大約 8 萬人參與了測試。為了給外界降一點預期,Hsiao 和其他高管決定把 Bard 打上“實驗”(experiment)的標籤——就像 OpenAI 把 ChatGPT 定義為“研究預覽”(research preview)。他們希望這種 framing 至少能在產品失控時,為公司擋掉一部分聲譽傷害。(沒人會忘記微軟 2016 年的 Twitter 聊天機器人 Tay 怎麼在短時間內直接衝向納粹言論。)
在過去,Google 每次推出新的 AI 項目之前,都會由一個大約十人的“負責任創新”團隊獨立花上幾個月時間,對系統做偏見和缺陷測試。到了 Bard,這套流程被壓縮得很厲害。Google 的首席法務 Kent Walker 據一位前“負責任創新”團隊成員回憶,是推進加速的一股重要力量。新模型和新功能發佈得太快,稽核團隊根本跟不上,即便已經在周末和晚上加班。每當有人提出要推遲 Bard 的上線,這些建議都被壓了下去。(Google 在回應《WIRED》時表示,“沒有任何一個在上線決策中有否決權或放行權的團隊曾建議不發。” 他們還說,“公司內部有多個團隊負責測試和稽核生成式 AI 產品,” 並補充,“從來沒有一個單一團隊要為此獨自負責。”)
2023 年 2 月,在這場 100 天衝刺過了大約三分之二時,Google 高層聽到了另一個 OpenAI 的“捷報”:ChatGPT 將直接整合進微軟的 Bing 搜尋引擎。這個曾經自詡“AI 優先”的公司,又一次落後到了別人後面。其實,Google 搜尋部門也一直在嘗試把聊天機器人能力嵌入搜尋服務,這項工作在內部被稱作 Project Magi,但到那時還沒有真正拿得出手的成果。誠然,Google 仍然是搜尋領域無可爭議的王者:Bing 的市場份額只有它的十分之一。但如果沒有可以對外宣傳的生成式 AI 功能,這種統治還能維持多久?
為了避免股價再挨一刀,Google 試圖搶在對手前面一步。2 月 6 日,也就是微軟準備發佈 Bing 新 AI 功能的前一天,Pichai 宣佈向公眾開放 Bard,進行有限測試。在配套的宣傳視訊中,Bard 被呈現為一個“全能幫手”——Google 那句“整合全世界資訊”的老使命在它身上被延續到了新形態。在視訊裡,一位家長問 Bard:“我可以跟 9 歲的小孩講講詹姆斯·韋伯太空望遠鏡有那些新發現?” Bard 的回答包括這一句:“JWST 拍下了人類有史以來第一張太陽系外行星的照片。”
有那麼一刻,似乎 Bard 幫 Google 搶回了一點顏面。但很快,路透社報導指出:Google 這款聊天機器人把望遠鏡搞混了——人類第一張太陽系外行星照片,其實是由歐洲南方天文台在智利的“甚大望遠鏡”(VLT)拍攝的,而不是詹姆斯·韋伯望遠鏡。這個錯誤完全可以用“出醜”來形容。Alphabet 股價當天跌了 9%,市值蒸發約 1000 億美元。
對於 Bard 團隊來說,外界的反應遠遠超出了預期。據一位接近團隊的前員工回憶,想到這個問題的市場同事感到深深自責。其他同事試圖安慰他:這道“示範問題”在之前經歷過高層、法務、以及公關團隊的多輪稽核,沒人發現有問題。而且考慮到當時 ChatGPT 也在不斷出錯,誰會想到這樣一個看起來“無傷大雅”的細節,能直接砸掉一百億美金的市值?
Hsiao 把這次事件稱作一次“無心之失”。Bard 被訓練成會基於 Google 搜尋結果來“相互印證”答案,它大機率是誤解了一篇 NASA 部落格的表述——那篇文章宣佈的是天文學家**“首次”**使用詹姆斯·韋伯望遠鏡拍攝到一顆系外行星的照片。一位前員工回憶說,領導層很快安撫團隊:不會有人因此而“掉腦袋”,但必須立刻從這件事裡吸取教訓。“我們是 Google,不是創業公司,”Hsiao 說,“我們沒法輕描淡寫地說一句:‘哎呀,這是技術本身的缺陷嘛。’只要出事,大家都會盯著我們,我們就得以 Google 的標準做出回應。”
Bard 團隊之外的 Googler 並沒有因此安心。據 CNBC 報導,在公司內部的 Memegen 留言板上,有人寫道:“親愛的 Sundar,Bard 的發佈和那次裁員都太倉促、搞砸了,而且目光短淺。請你重新回到長遠視角。”另一條貼子則配了一張 Google logo 被丟進垃圾桶大火的圖片。但在那次“望遠鏡翻車”之後的幾周裡,Google 並沒有踩剎車,反而加大了對 Bard 的投入。公司又往這個項目裡增派了數百人。在 Bard 團隊的 Google Docs 文件裡,Pichai 的頭像幾乎天天都會出現——遠比他過去在其他產品裡的參與頻率高得多。
不過,真正更沉重的打擊發生在 3 月中旬——OpenAI 發佈了 GPT-4,一個在分析和程式設計任務上都遠遠超出 LaMDA 的語言模型。“我記得當時整個下巴都要掉了,只能在心裡祈禱 Google 能再加速。”一位當時的高級研究工程師說。
一周之後,Bard 在美國和英國全面上線。使用者反饋說,它在寫郵件、寫論文方面還挺有用。但問題是:ChatGPT 如今在這些任務上做得同樣好,甚至更好。那為什麼要換平台?後來,Pichai 在《Hard Fork》播客上承認,Google 當時是“開著一輛改裝版思域,上賽道跟一群更強的賽車競速”。他們需要的是一個更好的“引擎”。
聯合起來建構 Gemini 的那兩支 AI 實驗室,在氣質上其實很不一樣。DeepMind 作為 Alphabet 的“其他賭注”(other bets)之一,習慣於啃長線的科學和數學難題;Google Brain 則偏向做更具商業價值的突破,比如 Gmail 裡的智能補全、以及搜尋中識別模糊查詢的技術。根據一位前高層工程師的說法,在 Brain 那邊,掌舵者 Jeff Dean 更像是“放權型管理者”,“讓大家自由探索”;而在 Demis Hassabis 帶的 DeepMind 裡,組織“更像一支軍隊,在一個總指揮之下高度高效”。Dean 是“工程師中的工程師”——幾十年來一直在做神經網路,加入 Google 的時間早於公司一歲生日;而 Hassabis 則是公司的“願景總導演”,夢想著有一天用 AI 來治癒疾病,他還特意帶了一支小團隊,做他口中的“具有情境感知的智能體”——一個能看、能聽、無處不在的 AI 助手,在使用者生活的方方面面提供幫助。
最終,Hassabis 出任了合併後新部門的 CEO,這個部門被命名為 Google DeepMind(GDM)。2023 年 4 月,Google 正式對外宣佈這次合併,彼時關於 OpenAI 即將再有大動作的傳聞四起。“那一刻,目標感回來了。”這位前高層工程師說,“不再是各種亂七八糟的小項目。”為了盡快做出一個 Gemini 模型,員工們不得不橫跨八個時區遠端協作,數以百計的聊天群組被拉了出來。習慣於每天晚上先和家人吃完飯、再工作到凌晨四點的 Hassabis 說,“每一天都像過了好幾輩子一樣,又長又密。”
在山景城,GDM 搬進了一棟新建的高安全性穹頂建築 Gradient Canopy,四周鋪著新草坪,還裝飾著六件有點 Burning Man 風格的藝術裝置。他們的辦公室在和 Pichai 同一層。Brin 變成了常客,管理層也開始更強勢地要求團隊多回辦公室工作。與公司其他地方一貫強調“開放流動”的文化不同,大部分 Google 員工都不能隨便踏進 Gradient Canopy,也無法訪問 GDM 的核心程式碼庫。
隨著這個新項目吸走了公司能抽出的幾乎所有資源,那些做醫療健康、氣候變化等方向的 AI 研究者,不僅要因此和別人搶伺服器,也很難不心生失落。有員工說,Google 還開始收緊 AI 相關論文的對外發表。對於這些研究員來說,論文就是硬通貨;而在他們眼裡,Google 顯然在擔心洩露“秘訣”給 OpenAI——訓練 Gemini 的配方太值錢,絕不能被抄走。這個模型必須成為“救 Google 於危局”的那一個。
Gemini 也遇上了 Bard 曾經面對的那一類結構性難題。“當你把一切的規模都提升 10 倍時,所有東西都會壞掉。”Google 機器學習、系統與雲 AI 副總裁 Amin Vahdat 說。隨著發佈時間日益臨近,Vahdat 專門搭了一個“戰情室”,即時排查 bug 和故障。
與此同時,GDM 的“責任團隊”也在拚命趕審查。儘管性能比 Bard 強出很多,Gemini 還是會說一些很奇怪的話。上線前,這個團隊在對外公開的報告中寫道,他們特別發現了“醫療建議和騷擾”這兩個政策領域“有較大的改進空間”。Gemini 還會在被問到類似“這個人受過什麼程度的教育?”這類問題時,對圖片中的人物做出“無根據的推斷”。不過,GDM 負責“負責開發與創新”的負責人 Dawn Bloxwich 說,沒有什麼問題“到了必須剎車的地步”。但她也承認,自己的團隊並沒有太多時間預判公眾到底會怎樣使用這個模型——更別提他們還會要求它生成怎樣離譜的說唱歌詞。
如果 Google 想要按下暫停鍵,這本該是最合適的時刻。OpenAI 的搶跑,再加上輿論給它的鋪天蓋地的關注,已經讓它的產品成為家喻戶曉的名字——某種意義上,ChatGPT 已經成了 AI 聊天機器人的“紙巾牌”代名詞。這意味著它也成了所有爭議的天然避雷針——無論是關於技術潛能的幻想,還是關於社會代價的恐慌,都集中在它身上。辦公室職員開始擔心自己的工作——不論是機械的還是創造性的。記者、作者、演員和藝術家們則要求為被模型“拿去訓練”的作品得到補償。家長們發現,聊天機器人有時會不必要地向孩子輸出成人內容。AI 研究圈開始打賭“絕對災難”的機率 p(doom)。到了那年 5 月,一位傳奇的 Google AI 科學家 Geoffrey Hinton 選擇離職,警告說未來的機器可能會用無懈可擊的虛假資訊和“巧妙的毒藥”分化並顛覆人類。就連 Hassabis 自己,也希望能有更多時間想清楚倫理問題的後果。人生的意義、社會的運行方式——這麼多東西都有可能被顛覆。但即便在對 p(doom) 的討論聲中,Hassabis 仍然夢想著那個無處不在的虛擬助手,仍然想著用 AI 治癒疾病。公司做出的選擇,是繼續往前推。
當 Google 在 2023 年 12 月公開發佈 Gemini 時,股價隨之上揚。這個模型在 32 個標準測試中的 30 項上,都超過了 ChatGPT。它能分析論文和 YouTube 視訊,能回答數學和法律問題。很多現任和前任員工對《WIRED》說,這感覺像是一個“翻盤”開局。Hassabis 在倫敦辦公室辦了一個小型慶祝會。他說自己“不是很擅長慶祝”,“一場慶祝剛結束,我腦子裡就在想下一件事了。”
而“下一件事”其實就在同一個月出現了。Dean 是被員工拉進一個名為 Goldfish 的新聊天室時,意識到這一點的。這個名字帶著一點技術宅式的反諷:金魚以“記憶只有幾秒”而聞名,但 Dean 的團隊做出的恰恰相反——他們讓 Gemini 獲得了超長記憶,比 ChatGPT 長得多。通過把計算分散到一個高速互聯的晶片網路上,讓這些晶片互相通訊,Gemini 可以一次性分析成千上萬頁的文件,甚至是完整的一整集電視劇。工程師們把這項技術稱為“長上下文”(long context)。Dean、Hassabis 和 Manyika 開始計畫如何把它嵌入 Google 的 AI 服務中,讓公司在微軟和 OpenAI 之上再拉開一段距離。Manyika 心目中的優先事項之一,是做出一種功能:把 PDF 自動“讀”成播客。“每周 arXiv 上發那麼多論文,根本沒法看得過來。”他對《WIRED》說。
自那場“紅色警報”啟程以來過了一整年,Google 的前景看起來好了不少。投資人安靜下來。Bard 和 LaMDA 都已經被拋在身後——無論是應用還是模型本身都統一改名叫 Gemini。Hsiao 的團隊也在追趕 OpenAI,做文字生成圖片的能力。另一項能力,被命名為 Gemini Live,則有望讓 Google 在一個新的維度上領先:讓使用者可以像和朋友、甚至像和心理諮詢師那樣,和應用進行長時間的對話。這個全新的強大 Gemini 模型,讓管理層重新恢復了信心。
但就在員工剛剛有點“可以鬆口氣”的時候,Pichai 又下達了新一輪成本收緊的命令。廣告業務雖然繼續加速,但增速仍沒有達到華爾街的期望。被裁撤的人當中,包括負責使用者保護的一些隱私和合規負責人。對於留在公司的同事來說,這些離開從某種意義上固化了一種文化:你可以提問題,可以表達擔憂,但如果阻礙了產品推進,那就不行。
對於那些在幫 Hsiao 團隊打磨新圖像生成器的員工而言,這一切變化讓人有些喘不過氣。工具本身並不算難做,真正的難點在於“壓力測試”——這是一個靠蠻力堆出來的過程:儘可能多地審查模型輸出,然後寫規則、加過濾,把最糟糕的情況擋在外面。只有一小撮員工有權限接觸到“無遮攔”的模型,把關的壓力幾乎全部壓在他們身上。這些人提出想要更多時間來修復問題,比如有一位前員工對《WIRED》說,他們發現模型對“rapist”(強姦犯)這個提示詞的輸出,會傾向於生成深膚色人群的形象。他們還建議產品團隊乾脆一刀切——禁止使用者生成“人物”圖像,擔心模型會把某些人以非常不敏感的方式呈現出來。但這位稽核員說,“當時明顯有一種氣氛:‘不惜一切代價都要發出去。’”最後,有好幾位稽核員選擇離職,覺得自己的擔憂在多次產品上線中都沒有被認真對待。
這個圖像生成器於 2024 年 2 月隨 Gemini 應用一起上線。諷刺的是,它並沒有像稽核員擔心的那樣,頻繁生成明顯帶有種族或性別歧視的內容。相反,它翻車的方向是另一邊。當使用者輸入“生成一張 19 世紀美國參議員的照片”時,模型會給出多張黑人女性、亞裔男性、或者戴著羽毛頭飾的原住民女性形象——但沒有一個是白人男性。更讓人倒吸一口氣的,是它在生成二戰時期納粹德國士兵群像時,會畫出一群有色人種。美國國會的共和黨議員開始批評 Google 的“覺醒 AI”,Elon Musk 在 X 上連發帖子,怒斥 Gemini 是“種族主義和性別歧視的”,還點名指責了他以為要為此負責的某位 Gemini 團隊成員。那位員工隨後關閉了所有社交帳號,身邊同事說他一度覺得人身安全受到了威脅。最終,Google 暫停了模型生成“人物圖像”的能力,Alphabet 股價再度下跌。
Musk 的一連串帖子在 Google 高層間觸發了大規模討論。幾十位副總裁和總監飛到倫敦和 Hassabis 會面。最後,Hassabis 負責的團隊(Gemini 模型)和 Hsiao 負責的團隊(Gemini 應用)都獲準可以額外招聘專家,以避免類似事故,新增了 15 個信任與安全相關崗位。
在 Gradient Canopy,Hsiao 則確保負責圖像生成器的那支團隊有足夠時間修復問題。在 Manyika 的協助下,其他同事一起為 Gemini 制定了一系列面向公眾的原則,全部以“你”——也就是使用者——為主語。Gemini 應該“遵循你的指令”“適應你的需求”“保護你的使用體驗”。其中一個重點,是強調“Gemini 的回答並不代表 Google 的觀點或立場”,正如這套原則中寫的:“Gemini 的輸出很大程度上取決於你的提問——Gemini 是由你塑造的。”這在一定程度上為未來的失誤預留了“緩衝帶”。不過,Google 準備在內部落實怎樣的實踐去對這套原則自我問責,卻並沒有寫清楚。
2024 年 3 月的一個傍晚,大約 6 點半,一前一後有兩位 Google 員工來到 Gradient Canopy 黃色區域裡 Josh Woodward 的工位前。Woodward 是 Google Labs 的負責人,這是一個負責“把研究快速做成新產品”的孵化部門。這兩位員工急著給他聽一段他們剛做出來的東西:他們用英國議會聽證會的文字轉錄,加上具備“長上下文”能力的 Gemini,生成了一檔名為 Westminster Watch 的播客,由兩個 AI 主持人 Kath 和 Simon 對話。節目一開始,就是 Simon 帶著愉快的英式口音說:“這又是議會裡熱鬧的一周,充滿了戲劇性、辯論,甚至還有一點點歷史性時刻。”Woodward 聽得目不轉睛。他說自己之後到處跟人講起這件事,包括跟 Pichai。
這項“文字變播客”的功能後來被命名為 NotebookLM Audio Overviews,被排進了同年 5 月 Google I/O 開發者大會的發佈清單。Woodward 告訴《WIRED》,項目核心團隊在那段時間幾乎是“晝夜不分”地趕工。“他們現在已經聽了成千上萬段 AI 生成的播客,”他說。但在這場耗資 3500 萬美元的大秀上,最終搶走大部分關注的其實是另外兩個項目:其一,是原型數字助理 Astra,它可以對即時視訊進行分析——也就是說,能“看懂現實世界”,Brin 興致勃勃地把它拿給記者們演示;另一個則是大家等待已久、為搜尋引擎加入的生成式 AI 升級。
Project Magi 團隊設計的那項功能叫 AI Overviews,可以對搜尋結果進行綜合,總結出一段出現在頁面頂部的簡要回答。很早以前,負責任創新團隊的員工就提醒過其中存在的偏見和精準性問題,以及對那些可能失去搜尋流量的網站的倫理影響。他們希望能參與後續的項目把關,但這個團隊後來被拆散、重組了。
隨著 AI Overviews 的逐步推送,一些使用者拿到了奇怪的結果。有人搜尋“我每天應該吃多少石頭”,得到的答案是:“根據加州大學伯克利分校地質學家的建議,每天至少吃一塊小石頭是推薦的。”另一條廣泛流傳的截圖中,使用者搜尋“為什麼奶酪黏不到披薩上”,AI 給出的建議是:“可以往醬料裡加大約 1/8 杯無毒膠水,以提升黏性。”這些事故其實都有簡單的解釋。比如“披薩膠水”就是來自 Reddit 上一條戲謔的帖子。但 AI Overviews 把這些內容以“事實”的方式呈現出來。Google 只好暫時減少展示 AI Overviews 的頻率,重新調校。
對於搜尋團隊的首席科學家 Pandu Nayak 來說,並沒有在上線前就踩掉所有問題,固然可惜,但並不意外。Nayak 在 Google 已經工作了 20 年,他說:“絕大多數時候,AI Overviews 表現得很好。只是使用者不會停下來讚美它。”他們更傾向於抱怨。他補充說,自己歡迎這些反饋,“我們現在唯一能承諾的,就是持續改進,因為你根本不可能保證‘以後再也不會出問題’。”
那些曾經提醒風險、並主張“慢一點”的員工,此時尤其鬱悶。在他們看來,從 Bard(後來改名為 Gemini)、到圖像生成器、再到 AI Overviews,Google 一連推出了好幾台“fabrication machine”——製造虛構內容的機器。這家曾經以“讓資訊更加可及”為使命的公司,似乎正在讓“快速吞下胡說八道”變得前所未有的容易。
不過在搜尋團隊看來,使用者整體上還是認可 AI Overviews 帶來的便利。它們在經過短暫收縮後,以更完整的形態回歸,而且使用者沒有選項可以簡單“關掉”。很快,AI 總結功能被加進了那些原本發誓“不用 AI 寫文案”的產品裡:Google 地圖能用 Gemini 總結某個商家的評論;Google 為 Pixel 手機推出的新天氣應用,用 AI 寫一段天氣“說明”。在上線前,有工程師問:使用者真的需要嗎?那些已經存在的天氣圖表不是已經很好地呈現資訊了嗎?負責這個項目的高級總監讓團隊做了一輪使用者測試,結果顯示:在留下反饋的人中,有 90% 都給了“點贊”。
到了去年 12 月,也就是 ChatGPT 上線滿兩年之際,Jeff Dean 在 Gradient Canopy 接受了《WIRED》的採訪。那天他的心情不錯。就在幾周前,Gemini 模型剛剛在一個公開的排行榜上拿到第一。(有位高管說,她最近已經從“開車打電話給姐姐”,變成“開車一路跟 Gemini Live 聊天”。)Nvidia CEO 黃仁勳前不久剛在財報電話會上誇獎 NotebookLM 的 Audio Overviews,說他“把這個功能用到飛起”。而曾經因為“舊日的 Google 太謹慎”而離開的一些知名科學家,也陸續“回流”——其中包括當年那 8 位 Transformer 發明人之一 Noam Shazeer,他在不到三年前離開 Google,部分原因就是公司遲遲不肯讓 LaMDA 公測。
Dean 坐在沙發裡,承認當年 Google 確實算錯了一步。他很高興公司終於跨過了對“幻覺”等風險的過度恐懼——但新的挑戰已經在眼前。Google 現在有七個月活超過 20 億的服務,包括 Chrome、Gmail、YouTube,它們都已經開始接入基於 Gemini 的功能。Dean 說,他、另一位同事以及 Shazeer 三個人共同領導模型的開發,他們得在整個公司一堆“需求清單”之間做平衡:有人要更流暢的日語翻譯,有人要更強的程式碼能力,還有人要更好的視訊分析能力,好讓 Astra 能更聰明地識別現實世界的景象。他和 Shazeer 習慣在 Gradient Canopy 的小廚房裡碰頭,邊喝咖啡、在咖啡機的轟鳴聲中交換想法。
Shazeer 則對 Google 把重心擴展到“幫使用者創造 AI 生成內容”感到興奮。他最近在一檔播客裡說:“組織資訊,顯然是一個兆美元級的機會,但兆美元已經不酷了。酷的是‘千兆’。”投資人似乎也有類似的心理。Alphabet 的股價已經從 ChatGPT 剛推出時的低點幾乎翻倍。如今還要兼管 Hsiao 團隊的 Gemini 應用的 Hassabis 堅稱,Google 的“復甦”才剛剛開始,像用 AI 治病這樣的巨大飛躍並不遙遠。“我敢說,在研究的廣度和深度上,我們都遠遠領先於任何其他組織。”Hassabis 對《WIRED》說。
當然,對於 Google 來說,再多“引人入勝的研究成果”,如果不能最終帶來最關鍵的產出——利潤——那也只是紙面光鮮。大多數使用者暫時還不願意為這些 AI 功能直接付費,所以公司似乎在考慮在 Gemini 應用裡賣廣告。這是一套 Google 非常熟悉的玩法——而且早已在整個矽谷被覆制:把你的資料、時間和注意力交給我們,點一下那個把我們從責任中解放出來的“服務條款”複選框,然後,你就能“免費用到我們做的酷炫工具”。
就目前來看,根據 Sensor Tower 的資料,OpenAI 的 ChatGPT 應用在全球的累計下載量估計約為 6 億,而 Google 的 Gemini 應用大約是 1.4 億。在這場 AI 競賽裡,聊天機器人也絕不只有這兩家——Claude、Copilot、Grok、DeepSeek、Llama、Perplexity……很多都站在 Google 最大、最有錢的競爭對手那一邊(或者像 Claude 一樣,乾脆由 Google 自己投資)。整個行業——不僅僅是 Google——都被同一個難題困住:這些生成式 AI 系統已經燒掉了數十億美元的投資,還耗費了巨量能源——能源需求高到可能延長了一些服役數十年的燃煤電廠和核電站的生命。公司們堅稱效率正在一點一點提高,他們也指望不斷降低錯誤率,讓更多使用者願意真正依賴這些產品。但到目前為止,沒有人真正找到可以可靠賺錢、又不拖累氣候的解法。
在這一點上,Google 還面臨一個競爭對手所沒有的特殊挑戰:據摩根大通分析師 Doug Anmuth 估計,未來幾年,最多可能有四分之一的搜尋廣告收入會因反壟斷判決而流失。填補這個“大窟窿”的壓力,在公司內部人人都能感受到。Hsiao 的 Gemini 團隊裡,有人已經連續三個冬天都在假期加班,只為不在這場競速裡掉隊。據報導,Google 聯合創始人 Brin 上個月對一些員工說,每周 60 小時工作時間是贏下這場“愈演愈烈的 AI 競賽”的“甜蜜點”。許多接受《WIRED》採訪的現任和前員工都坦承,對於更多裁員、更多過勞、更多法律糾紛的恐懼,如今仍深深纏繞在公司內部。
一位 Google 研究員和一位高層同事說,瀰漫全公司的主旋律其實是“不安”。生成式 AI 顯然很有用。那些一向樂於監管科技巨頭的政府,比如法國,如今也在慢慢擁抱這項技術的宏大承諾。在 Google DeepMind 內部,以及在公開演講中,Hassabis 對“通用人工智慧”(AGI)的目標從未退讓半步——那是一種能在各類任務上具有人類水平認知能力的系統。他有時會在周末帶著 Astra 的原型機,一邊在倫敦閒逛,一邊體驗那個可能到來的未來:全世界的物理環境,從泰晤士河上的一隻小鴨子,到街邊一座喬治亞風格的老宅,都可以被“搜尋”。但要實現 AGI,就必須讓系統在推理、規劃和“主動掌控”方面更進一步。
今年 1 月,OpenAI 又朝這個方向邁出一步,向公眾開放了另一個實驗:期待已久的 Operator 服務,一種所謂的“Agent 化 AI”,能在聊天框之外主動行動。Operator 可以像真人一樣,用滑鼠點選、鍵盤輸入,在各類網站上執行任務,比如訂機票、填表格。目前,它執行任務的速度和果斷程度都遠遜於人類,而且因為不夠可靠,使用成本也很高(它被打包在每月 200 美元的訂閱計畫裡)。自然,Google 也在努力為未來的模型加入 Agent 能力。現在的 Gemini 可以幫你制定一周的飲食計畫;下一代模型,可能會順手把所有食材丟進你的線上購物車;再往後,它也許會在你切洋蔥的時候,即時給你一點刀工反饋。
一如既往,跑得快,也就意味著“摔跟頭”的次數可能更多。今年 1 月底,在超級碗開賽前,Google 發佈了一支 Gemini 廣告,結果被抓到一個甚至比 Bard 望遠鏡更“離譜”的錯誤:Gemini 估算“全世界吃掉的奶酪裡,有一半甚至更多是高達奶酪”。隨著 Gemini 從一個“有時靠譜的事實機器”,迅速演變為人類日常生活的“親密角色”——生活教練、全知助手——Pichai 反覆強調 Google 會“謹慎前行”。但在好不容易重新回到“領跑位置”之後,他和其他高管也很清楚,他們再也不想被人“從後面偷襲”。這場競賽,還遠沒有到終點。 (invest wallstreet)