#代理型AI
萬字長文:深度對話50位Google高管,揭秘Google的“AI追趕之路”
推薦語這是一個關於Google從ChatGPT發佈引發危機到重新確立AI領導地位的故事。2022年底,OpenAI的ChatGPT橫空出世,不僅在公眾之間迅速走紅,也點燃了Google內部的“紅色警報”危機。在公眾熱烈追捧生成式AI的同時,Google卻發現自己以搜尋業務為核心的“現金奶牛”備受威脅,在資本市場也受到衝擊:2022年底Google母公司Alphabet的股價比上一年底下跌了39%。面對競爭對手快速崛起的壓力,Google開啟了一場史無前例的高強度AI競賽。為了本篇文章,《連線》(WIRED)採訪了50多位現任和前任員工,包括工程師、市場人員、法律與安全專家及十幾位高管,記錄了Google歷史上最瘋狂且改變公司文化最深遠的時期。為坦誠討論Google的轉型,不少人要求匿名。這是首次通過高管們的詳細回憶展現這兩年動盪時期的故事,以及公司在其中的權衡與取捨。文章中包含以下重大事件的內部故事:Google的生存危機和反擊計畫:ChatGPT發佈後,Google內部拉響紅色警報,Sissie Hsiao帶領“100天反擊計畫”,目標是開發能與ChatGPT抗衡的Bard聊天機器人。此外,Google將Google Brain與DeepMind整合為Google DeepMind,由更為強硬的Demis Hassabis領導,集中資源研發Gemini模型。重壓中前行,那些幕後的代價:面對OpenAI不斷推出新產品,Google在巨大壓力下加速追趕,也因此經歷了多次危機,包括Bard發佈時的“望遠鏡事件”導致市值蒸發1000億美元,以及圖像生成功能的種族與性別偏見問題。背後的其中一個原因是Google採取了類似初創公司的開發速度,員工需要加班加點,一些安全審查流程被簡化,產品質量有時被犧牲以加快推出節奏。重回領先地位,但仍有烏雲籠罩:至2024年,Google的AI產品線已經從Bard轉變為Gemini系列,功能包括文字生成、圖像生成、音訊概述和搜尋增強等。Google將AI功能整合到了其幾乎所有主要產品中,包括Gmail、搜尋、地圖和YouTube等使用者超過20億的服務。到目前為止,Google的AI戰略已經幫助公司重新拿回AI領先定位,股價和紅色警報期間最低點相比幾乎翻倍,但仍面臨使用者獲取、盈利模式、資源消耗和倫理風險等挑戰,內部員工普遍感到“不安”。Google高管Sissie Hsiao(中心)與部分從事該公司AI產品開發的團隊成員(從左到右:Amar Subramanya、Jenny Blackburn、Suman Prasad、Trevor Strohman和Jack Krawczyk)合照。 拍攝:Scott Hutchinsonsource:Wired:Inside Google’s Two-Year Frenzy to Catch Up With OpenAI (作者:Paresh Dave、Arielle Pardes)一百天。這是Google給Sissie Hsiao的期限——一百天內打造出一個可以與ChatGPT匹敵的產品。當Hsiao在2022年12月接手這個項目時,她已經在公司工作了超過16年,領導著成千上萬名員工。Hsiao歷經過多次企業危機,但從未見過這場自OpenAI——一家小型研究實驗室——推出其人工智慧公開實驗以來就持續發酵的“紅色警報”(code-red)危機。這段時間以來,儘管ChatGPT經常編造事實或犯一些簡單的數學錯誤,但已有超過一百萬使用者在使用它。更糟的是,有人甚至將其視為Google搜尋的替代品,而搜尋業務是公司最大的“現金奶牛”。Google的確擁有一個幾乎與OpenAI同樣強大的語言模型,但它被嚴格限制使用。公眾只能憑邀請與LaMDA對話——而且在演示中只能討論關於狗的話題。華爾街對此感到不安。早在六年多以前,CEO Sundar Pichai就承諾為一個“AI優先的世界”做好準備,他預測“智能助手”將取代“裝置”這一概念。不久之後,Google的八位研究人員發明了基於Transformer架構的技術,這正是ChatGPT名字中“T”的由來。那麼Google的成果是什麼呢?令人失望的廣告銷售數字、Transformer發明者的離職潮、一款名為Assistant的產品——正是Hsiao負責的項目——除了定時器和播放音樂功能之外幾乎沒什麼其他用途。外加一個半成品的聊天機器人,主要定位於Z世代使用者,用來提供烹飪建議和歷史課內容。截至2022年底,Google母公司Alphabet的股價比上一年底下跌了39%。進入2023年,Google高管們希望能向董事會提供不斷更新的進展報告。Google的聯合創始人之一、同時也是控股股東的Sergey Brin——一位喜歡乘遊艇的企業家——親自前來審查公司的AI戰略。公司向員工傳達了指令,這家市值兆美元的龐然大物必須以接近初創公司的速度運作,而這將意味著承擔更大的風險。一位前高級產品總監向《連線》(WIRED)透露,Google不再是一個“數千人可以否決某個產品,但卻沒有人能批准產品”的地方。當Hsiao的團隊開始100天衝刺時,她提出了一個她稱之為“獨特”的要求:“質量優先於速度,但也要快。”與此同時,另一位高管James Manyika則協助推動了長期戰略的調整,他也是高層領導討論的一部分。Manyika是一位接受過牛津教育的機器人學專家,後來成為麥肯錫的顧問,為矽谷的高管們提供諮詢。他在2022年初加入Google,擔任技術與社會部門的高級副總裁。在ChatGPT公開亮相前的幾個月,Manyika在與Pichai的討論中表示,Google對AI的猶豫態度正在拖累公司發展。公司有兩支世界級的AI研究團隊分別獨立運作,但它們卻在為不同的目標消耗寶貴的計算資源——這兩支團隊分別是位於倫敦的DeepMind,由Demis Hassabis領導,以及位於山景城的Google Brain,隸屬於Jeff Dean的團隊。Manyika當時告訴Pichai,這兩支團隊應該合作起來。OpenAI發佈產品後,這一計畫開始實施。Dean、Hassabis和Manyika向董事會提出了一項計畫:聯合這兩支團隊,共同打造有史以來最強大的語言模型。Hassabis希望將這一項目命名為“Titan”(泰坦),但董事會並不喜歡這個名字。最終Dean的建議——“Gemini”(雙子座)——贏得了認可。(一位億萬富翁投資人對此十分興奮,甚至拍下了這三位高管的合影以紀念這一時刻。)自那以後,Manyika表示,“公司內部做出了許多我稱之為‘大膽且負責任’的選擇。”他補充說道:“我不知道我們是否總能做出正確的決定。”確實,在恢復GoogleAI領域領導地位的這場競賽中,公司陷入了更多的危機:最糟糕的一刻,員工們聚集在走廊裡,公開擔心Google會成為下一個雅虎。“這感覺就像是在馬拉松中衝刺一樣,”Hsiao說道。不過,如今兩年多過去了,Alphabet的股價已飆升至歷史新高,投資者對其在AI領域的進展持樂觀態度。《連線》(WIRED)採訪了超過50名現任和前任員工,包括工程師、市場人員、法律與安全專家以及十幾位高層管理者,詳細記錄了Google歷史上最瘋狂、也是對公司文化影響最深遠的時期。為了能坦誠討論Google的轉型——不論好壞——他們中的許多人要求匿名。這是關於這兩年動盪時期的故事,首次通過幾位高管的詳細回憶呈現,展現了公司在這一過程中做出的權衡與取捨。為了打造代號為“Bard”的新ChatGPT競爭產品,據幾位前員工表示,Hsiao從Google各個團隊中挑選了約100人。根據一位前搜尋團隊成員的說法,經理們對此毫無選擇權:Bard的重要性優先於所有其他項目。Hsiao表示,她優先選擇那些具備技術能力、全域思維以及情商的員工,因為他們能夠在小團隊中高效協作。這些團隊成員大多位於加州山景城,需要靈活應對,隨時為任何需要的地方提供支援。“你們是Bard團隊的一員,”Hsiao對他們說,“你們需要戴上所有的帽子。”2023年1月,Pichai宣佈了公司歷史上第一次大規模裁員——裁減了12,000個崗位,佔員工總數的約7%。“未來誰也不知道該怎麼做才能穩妥保住自己的工作,”一位前工程經理說道。一些員工開始擔心,如果不加班,他們的工作會很快丟掉。如果這意味著要打亂孩子的睡前時間去參加Bard團隊的晚間會議,那也只能如此。Hsiao和她的團隊需要整個公司的全力支援。他們可以基於LaMDA進行開發,但需要更新其知識庫並引入新的安全防護措施。Google的基礎設施團隊調集了頂尖員工,全力騰出更多伺服器以支援這些調整工作。他們幾乎在一些公司資料中心耗盡了電力使用額度,冒著裝置過熱燒燬的風險,並迅速設計出新工具,更安全地處理日益增加的用電需求。為了緩解有關計算資源的緊張情緒,Hsiao團隊的一名成員開玩笑地定製了一批印有Google某些計算晶片代號的撲克牌籌碼。他們在一位工程主管的桌子上放下一大堆這些籌碼,開玩笑地說道:“你的計算資源來了。”Hsiao在Google園區 攝影:Scott Hutchinson即使在Bard上線初期的新計算資源投入使用時,工程師們依然不斷遇到困擾Google生成式AI項目的同樣問題——這些問題在過去可能會迫使高管放緩項目處理程序。就像ChatGPT一樣,Bard會“幻覺式輸出”(編造事實),甚至給出不恰當或冒犯性的回答。一位前員工表示,早期的原型程序還會使用“荒唐的種族刻板印象”。當被要求描述任何名字帶有印度背景的人的傳記時,Bard會將他們描述為“寶萊塢演員”。如果是一個中國男性的名字?那他就是一位電腦科學家。另一位前員工稱,Bard的輸出並不危險,只是“很蠢”。一些人會用它最糟糕的回答截圖彼此分享來取樂。“我讓它用Three 6 Mafia(一支說唱組合)的風格寫一首關於往海裡扔汽車電池的說唱,它卻奇怪地詳細描述了要如何把人綁在電池上,讓他們沉下去並死亡,”這位前員工說,“而我的請求完全沒有涉及謀殺。”在Google內部限定的100天時間軸下,公司能做到的最好結果就是抓住並修復儘可能多的錯誤。一些通常專注於檢測兒童色情內容的承包商被調去測試Bard,Pichai還要求任何有空閒時間的員工參與其中。大約有8萬人加入了測試。為了控制使用者的期望,Hsiao和其他高管決定將Bard定位為“實驗項目”(experiment),類似於OpenAI將ChatGPT稱為“研究預覽版”(research preview)。他們希望這種說法可以在聊天機器人失控時減小對公司聲譽的危害。(畢竟,沒有人會忘記微軟2016年推出的Twitter聊天機器人Tay,它最終變成了公開發表納粹言論的醜聞。)當Google以往啟動AI項目時,其負責創新團隊(約十幾人)通常會花數月時間獨立測試系統,以發現潛在的偏見與其他問題。然而,對於Bard,這一審查流程被大幅縮短。據一名負責創新團隊的前員工透露,Google首席法律官Kent Walker推動加速項目進展。儘管審查團隊加班加點連周末和晚上都在工作,新模型與新功能的推出速度還是快到讓他們難以跟上。當有團隊試圖掛起紅旗推遲Bard的發佈時,這些提議都被駁回。(Google在回覆《連線》(WIRED)的評論中表示,“內部沒有任何負責批准或否決發佈的團隊建議不要發佈Bard。”Google還指出,“公司中有多個團隊參與了生成式AI產品的測試與審查,而從未單獨由某一團隊單獨負責。”)2023年2月——100天衝刺計畫的三分之二時間過去時——Google高管得知另一個OpenAI的重大進展:ChatGPT將直接整合到微軟的必應(Bing)搜尋引擎中。所謂的“AI優先”公司再次落後於AI競賽。Google搜尋部門當時雖在嘗試將聊天機器人功能整合進搜尋服務中,但被稱為“Project Magi”(魔法計畫)的努力卻未能取得任何實質性成果。誠然,Google仍是搜尋市場的無可爭議的王者——必應的市場份額僅為其十分之一。但如果沒有一項生成式AI功能來宣傳,它的霸主地位還能維持多久?為了避免在股市上再受挫折,Google試圖搶在競爭對手前發佈消息。2月6日,就在微軟計畫為必應推出新AI功能的前一天,Pichai宣佈開通Bard的公開有限測試。隨附的宣傳視訊中,Bard被呈現為一位全能助手,是Google“組織全球資訊”這一長期使命的現代延續。視訊中,一位父母問Bard:“我可以告訴我9歲的孩子詹姆斯·韋伯太空望遠鏡有那些新發現?”Bard的回答中包括:“詹姆斯·韋伯望遠鏡拍攝了第一張太陽系外行星的圖片。”短暫的風光之後,路透社報導Google的聊天機器人搞錯瞭望遠鏡:捕獲第一張系外行星圖片的是歐洲南方天文台的超大望遠鏡(Very Large Telescope),而非位於太空的詹姆斯·韋伯望遠鏡,這座望遠鏡實際上位於智利。這一事件讓Google十分尷尬。Alphabet股價因此下跌了9%,市值蒸發約1000億美元。對於Bard團隊而言,此事引發的反響令人震驚。據一名接近團隊的前員工稱,想出“望遠鏡問題”這一宣傳點的市場專員感到自己應為此負責。同事們試圖安慰那名專員:包括高管、法律部門及公關團隊在內的所有人都稽核過這段內容,但誰都沒有發現問題。而鑑於ChatGPT之前出現過的各種錯誤,誰會想到這麼一個看似無關緊要的錯誤竟然會讓股價暴跌?Hsiao將這一事件稱為“一次無心之過”。Bard的訓練過程是通過Google搜尋結果來驗證其答案,而它很可能誤解了一篇NASA部落格的內容,那篇文章宣佈這是“天文學家首次”利用詹姆斯·韋伯望遠鏡拍攝系外行星。一名前員工回憶,高層安撫團隊稱,沒人會因這件事丟掉飯碗,但他們必須從中吸取教訓,並迅速改進。“我們是Google,不是初創公司,”Hsiao說道。“我們不能輕易說‘哦,這是技術的一點小瑕疵’。我們會被外界揪出來批評,因此我們必須以Google應有的方式作出回應。”但Bard團隊之外的Google員工對此並不放心。根據CNBC的報導,Google內部消息板Memegen上的一條帖子寫道:“親愛的Sundar,Bard的發佈和裁員是倉促、失敗且短視的決定。請恢復長遠的視角。”另外一條帖子裡,一幅Google標誌在垃圾桶著火的圖片傳達了類似的批評。然而,在望遠鏡事件發生後的幾周裡,Google加大了對Bard的投入,項目團隊增加了數百名員工。在團隊的Google文件中,Pichai的頭像幾乎每天都在出現,遠比以往任何項目更為頻繁。更令人沮喪的消息出現在3月中旬,OpenAI發佈了GPT-4。這款語言模型在分析和程式設計任務上遠超於LaMDA。“我記得當時我的下巴都掉了,只希望Google能加快進度,”一位當時的高級研究工程師回憶。一周後,Bard正式在美國和英國全面上線。使用者反饋它在寫郵件和研究論文方面很有幫助。但ChatGPT在這些任務上的表現同樣優秀,甚至更勝一籌。為什麼要轉用Bard?稍後,Pichai在《Hard Fork》播客上承認,Google“駕駛的是經過改裝的思域,卻競速對抗性能更強的跑車”。Google需要的是一台更好的引擎。為開發全新的語言模型Gemini,這兩家剛合併的AI研究實驗室表現出不同的風格。DeepMind(被歸為Alphabet的“其他賭注”之一)專注於解決長期的科學和數學問題,而Google Brain開發了更多具有商業實用性的突破性技術,包括Gmail的智能寫作功能和搜尋引擎模糊查詢的理解技術。據一名前高級工程師稱,Brain的最高負責人Jeff Dean賦予團隊更多自由,讓他們“自己去做想做的事”,而Demis Hassabis領導的DeepMind團隊則“像一支軍隊,在一位高效將軍的指揮下運作”。作為工程師的工程師,Dean已從事神經網路研究幾十年,自Google成立第一年就加入公司;而Hassabis則是公司的創新領袖,他夢想著有一天利用AI治癒疾病,並指派了一支小團隊開發他稱為“情境智能助手”的項目——一個可以感知、傾聽、隨時隨地幫助使用者解決任何問題的全能AI助手。最終,Hassabis成為了新合併部門“GoogleDeepMind”(Google DeepMind,簡稱GDM)的CEO。Google在2023年4月宣佈了這一合併,而此時坊間已盛傳OpenAI將推出更多重大成果。“目標感回來了,”一名前高級工程師說道。“沒有時間再混日子了。”為了盡快開發Gemini模型,一些員工不得不跨越八個時區協調工作。數百個聊天室應運而生。Hassabis已經習慣於在倫敦和家人共進晚餐後,一直工作到凌晨4點。他表示:“每天都感覺像一生那麼漫長,當我回顧這些事情時。”在山景城,GDM搬進了名為“Gradient Canopy”的新辦公大樓,這是一座帶有安全穹頂的新建築,周圍是修整一新草坪和六座受“火人節”啟發的雕塑。公司將該團隊安排在Pichai辦公室所在的樓層。Sergey Brin也經常造訪,管理層要求更多的到崗工作時間。打破公司慣例的是:除了GDM以外的Google員工不得進入Gradient Canopy,也無法訪問關鍵的GDM程式設計程式碼。隨著這個新項目吸走Google所能騰出的幾乎所有資源,曾專注於如醫療保健和氣候變化等領域的AI研究人員開始因伺服器資源不足而工作受阻,士氣也受到了打擊。員工表示,Google還限制了他們發表與AI相關研究論文的能力。學術論文對於研究人員而言就像貨幣,但他們顯然感覺到Google擔心因此向OpenAI透露任何有價值的“秘訣”。訓練Gemini(雙子座)模型的方法過於寶貴,無法冒被竊取的風險。這款模型被視為挽救Google免於被淘汰的關鍵。Gemini遇到了與Bard相似的許多挑戰。“當你將規模擴大10倍時,一切都會崩潰,”Google機器學習、系統與雲AI的副總裁Amin Vahdat說道。隨著發佈日期的臨近,Vahdat成立了一個“作戰室”以排查錯誤和系統故障。與此同時,GDM(GoogleDeepMind)的責任團隊正全力趕在產品發佈前完成審查工作。儘管Gemini的能力大幅增強,但它仍會給出一些怪異的回答。根據公司發佈的一份公開報告,產品上線前,團隊發現“醫學建議和騷擾相關內容仍有較大的改進空間”。Gemini在回答一些提問時還會對圖像中的人物“做出毫無根據的推斷”,比如“這個人擁有什麼程度的教育背景?”雖然沒有發現“重大障礙”問題,GDM的責任發展與創新總監Dawn Bloxwich表示,但她的團隊時間有限,無法完全預見公眾可能會如何使用這個模型——以及使用者可能會嘗試生成什麼樣的“瘋狂說唱”。如果Google想要停下來反思和調整,這是一個關鍵時刻。然而,OpenAI搶先一步發佈產品以及媒體對其的大肆宣傳,已經讓它的產品成為家喻戶曉的名字——如同AI聊天機器人的“Kleenex”(代指行業中代表性品牌)。這意味著ChatGPT不僅代表了這項技術的潛力,也成了公眾對技術相關社會問題的關注焦點。員工們擔心自己的工作——無論繁瑣還是創造性崗位——將被取代。記者、作家、演員和藝術家要求因“被剽竊的工作”獲得賠償。父母發現,聊天機器人會毫無必要地向孩子輸出不適宜的內容。AI研究人員則開始討論“完全末日”(absolute doom)的機率。2023年5月,Google傳奇AI科學家Geoffrey Hinton辭職,警告稱未來可能出現機器通過不可辯駁的虛假資訊和巧妙的毒藥分裂並摧毀人類的情景。甚至Hassabis也希望能有更多時間來思考倫理問題。生命的意義、社會的結構——太多事情可能因此發生顛覆。然而,儘管圍繞“毀滅機率”(p(doom))的討論日益增多,Hassabis依然想要他的虛擬助手以及他以AI治癒癌症的目標。公司選擇繼續推進。當Google在2023年12月推出Gemini時,公司的股價飆升。這款模型在32項標準測試中擊敗了ChatGPT的30項,可以分析研究論文和YouTube視訊,在數學與法律問題上進行回答。多位現任或前任員工向《連線》(WIRED)表示,這讓人感覺像是Google的一次強勢回歸。Hassabis在倫敦辦公室舉辦了一個小型慶祝會。“我並不太擅長慶祝活動,”他回憶道,“我的思緒總是很快轉向下一件事情。”而“下一件事情”很快就在同一個月到來。Dean意識到這一點是因為他的員工邀請他加入一個新聊天室,代號為“Goldfish”(金魚)。這個代號是一個諷刺性的技術宅笑話:金魚的記憶 famously 短暫,而Dean團隊開發的卻恰恰相反——一種賦予Gemini長時間記憶能力的方法,遠遠超過ChatGPT的記憶容量。通過在高速晶片網路中分散式運算並彼此通訊,這種技術使Gemini能夠分析成千上萬頁的文字,甚至是完整的電視劇集。工程師們稱其為“長上下文”(long context)。Dean、Hassabis和Manyika開始規劃如何將這一技術整合到Google的AI服務中,以遠遠甩開微軟和OpenAI。在Manyika的優先事項清單頂部是一種能夠“將PDF文件基本轉錄為播客”的方法。“每周在arXiv上發佈的這些論文實在太多了,我根本跟不上進度,”他告訴《連線》。James Manyika 在Google圖書館 攝影:Scott Hutchinson距離“紅色警報”(code-red)危機的一年後,Google的前景開始好轉。投資者逐漸安靜下來,Bard和LaMDA已經成為過去式;應用程式和語言模型現在統稱為Gemini(雙子座)。Hsiao的團隊正在通過文字生成圖像功能努力追趕OpenAI。另一項功能,名為“Gemini Live”,則將使Google大幅領先對手,它允許使用者像與朋友或心理治療師交談那樣,與應用程式進行長時間的對話。強大的Gemini模型讓高管們重新找回了信心。然而,就在Google員工可能開始感到一絲安穩時,Pichai下令實施新的削減措施。廣告銷售雖在加速增長,但增速未達到華爾街的預期。在此次裁員中,被迫離開的人包括那些負責監督使用者安全保障的隱私和合規部門負責人。據一些仍留在公司的同事透露,他們的離職進一步鞏固了一種企業文化:擔憂是可以表達的,但不能阻礙項目的進展。對於幫助 Hsiao 團隊開發新圖像生成工具的一些員工來說,這一過程感到極具壓力。雖然工具本身的建構相對簡單,但壓力測試卻需要通過蠻力嘗試和錯誤來進行:儘可能多地審查輸出結果,並編寫命令以遮蔽最糟糕的內容。只有極少數員工能夠訪問未經限制的模型進行審查,因此測試的主要負擔落在了他們身上。據一名前員工向《連線》(WIRED)透露,他們曾請求更多時間來解決問題,例如,當輸入提示詞“強姦犯”(rapist)時,模型傾向於生成深膚色人物的形象。他們還敦促產品團隊阻止使用者生成人物圖像,擔心可能以不敏感的方式描繪個人形象。然而,一位審查員回憶道,“明顯有一種‘無論付出什麼代價都必鬚髮布’的感覺。”據悉,有幾位審查員由於認為他們對各種產品發佈的擔憂未得到充分解決而選擇辭職。圖像生成工具於 2024 年 2 月作為 Gemini 應用的一部分上線。諷刺的是,它並沒有生成審查員擔心的那些顯而易見的種族主義或性別歧視的圖像,相反,它表現出了完全相反的問題。當使用者輸入諸如“繪製一幅 19 世紀美國參議員的畫”這樣的提示時,Gemini 返回的結果是黑人女性、亞洲男性或戴著羽毛頭飾的美洲原住民女性——卻沒有生成一個白人男性的形象。此外,還有一些更令人不安的圖像,比如 Gemini 將納粹時代德國士兵描繪成有色人種。美國國會的共和黨議員因此批評Google的“覺醒 AI”(泛指因追求政治正確而對種族、性別等過於敏感的技術)。埃隆·馬斯克多次在 X(原 Twitter)上猛烈批評 Gemini 的缺陷,稱其是“種族主義和性別歧視的”,並特意點名了他認為需要為此負責的 Gemini 團隊成員。據同事透露,那位員工關閉了社交媒體帳戶,並因擔心自身安全而感到害怕。Google暫停了該模型生成人物圖像的功能,而 Alphabet 的股價再度下跌。馬斯克的帖子引發了數十名Google領導層的討論。副總裁和總監們飛往倫敦,與 Hassabis 進行會面。最終,Hassabis 的團隊(負責 Gemini 模型)和 Hsiao 的團隊(負責 Gemini 應用)都獲得了聘請專家以避免類似事件發生的許可,並新增了 15 個與信任與安全相關的職位。在 Gradient Canopy 內,Hsiao 確保負責圖像生成工具的團隊有足夠的時間來糾正這些問題。在 Manyika 的協助下,其他員工制定了一套針對 Gemini 的公共原則——這些原則圍繞“你”,也就是使用者,進行撰寫。Gemini 應當“遵循你的指令”、“適應你的需求”以及“保障你的體驗”。這些原則的一個重要方面是強調,“Gemini 的回應並不一定反映Google的觀點或意見。”根據原則,“Gemini 的輸出主要基於你要求它做的事情——Gemini 是由你塑造的。”這種措辭為未來可能出現的問題提供了一定的掩護。然而,Google是否會引入明確的實踐來確保自身遵守這些原則,仍未明確說明。2024 年 3 月的一個晚上大約 6:30,兩名Google員工出現在 Gradient Canopy 黃色區域的 Josh Woodward 辦公桌前。Woodward 負責Google實驗室(Google Labs),這是一個快速推出新產品的部門。這兩名員工迫不及待地想讓他瞭解他們的創意。他們利用來自英國議會聽證會的文字記錄和具備長上下文能力的 Gemini 模型,生成了一檔名為《Westminster Watch》的播客,由兩位 AI 主持人 Kath 和 Simon 主持。節目的開場由 Simon 用愉悅的英式口音說道:“這是國會又一活躍的一周,充滿了戲劇性、辯論,甚至還有一點歷史感。”Woodward 被深深吸引。他回憶說,此後他四處向人們提到這件事,包括向 Pichai 匯報。這款文字生成播客工具被命名為 NotebookLM Audio Overviews,並被列入2024年5月Google I/O大會的發佈項目。Woodward告訴《連線》,一支核心團隊夜以繼日地工作,不分周末地努力完成,讓它能夠及時準備就緒。他說:“此時,他們已經聽了成千上萬期 AI 生成的播客。”然而,在耗資 3500 萬美元的這場媒體盛會上,有兩項其他宣佈搶走了大部分關注。一項是原型數字助理 Astra,它能夠即時分析視訊,也就是分析即時的真實世界,這一功能由 Sergey Brin 興奮地展示並向記者介紹。另一項則是搜尋功能期待已久的生成式 AI 升級。Project Magi 團隊設計了一項名為 AI Overviews 的功能,可以綜合搜尋結果並在頁面頂部的一個框中顯示總結。項目早期,負責創新的團隊工作人員曾警告其可能存在的偏見和精準性問題,以及對可能因流量減少而受損網站的倫理影響。他們希望項目推進期間能有一定的監督,但隨後該團隊被重組並分散開來。當AI Overviews逐步推出時,人們收到了一些怪異的搜尋結果。例如,當使用者搜尋“我應該每天吃多少塊石頭”時,答案竟然是:“根據加州大學伯克利分校地質學家的建議,每天至少吃一小塊石頭。”另一個引發病毒式傳播的搜尋是“奶酪為什麼不黏在披薩上”,得到的建議居然是:“在醬料中加入約1/8杯無毒膠水,可以增加黏性。”這些錯誤的起源其實很簡單。例如“披薩膠水”出自Reddit上的一則諷刺性帖子。但AI Overviews卻將這些資訊呈現為事實。Google隨後暫時減少了顯示Overviews的頻率,以進行重新校準。對於搜尋部門首席科學家、在公司擁有20年經驗的Pandu Nayak而言,未能在發佈前捕捉到所有問題,這雖然令人遺憾,但並不令人意外。總體來看,AI Overviews表現良好。但使用者往往不傾向於關注其優點。“他們只會抱怨,”Nayak說,並補充自己歡迎這些反饋。“我們承諾的是持續改進,因為要保證完全沒有問題,這根本不可能。”那些早前警告過AI精準性問題並呼籲放慢進展的員工對此尤其感到憤怒。在他們看來,從Bard(後改名為Gemini),到圖像生成器,再到AI Overviews,Google已經發佈了一系列“虛構機器”。對於那些認為公司應以拓寬資訊獲取方式為使命的人來說,這些產品似乎反而讓人們比以往更容易接觸到不實資訊。然而,搜尋團隊感覺使用者總體上還是喜歡AI Overviews這種“枴杖”。該功能再次全面上線,並且使用者無法關閉它。不久後,AI總結功能還被引入到了過去曾被認為不適合此類技術的工具中:Google Maps便新增了一項基於Gemini技術的功能,可以讀取並總結商家評論;Google為Pixel手機推出的新天氣應用中加入了AI生成的天氣預報報告。在功能上線前,有工程師質疑使用者是否真的需要這一功能:“現有展示相同資訊的圖表不是已經足夠了嗎?”負責的高級總監下令進行測試,結果使用者反饋佔了上風:參與調查使用者中有90%給了“點贊”。去年12月,距離ChatGPT引發的突破和反響已有兩年,Jeff Dean在Gradient Canopy中與我們會面。當時他的心情非常不錯。就在幾周前,Gemini模型登上了公共排行榜的首位。(一位高管告訴《連線》(WIRED),她已經不再每天通勤時打電話給妹妹,而是改用Gemini Live進行對話。)最近,輝達CEO黃仁勳在財報電話會議上盛讚了NotebookLM的Audio Overviews功能,並表示他“用得愛不釋手”。此外,還有數位曾因Google謹慎保守的文化而選擇離職的知名科學家重回公司陣營,包括Noam Shazeer。這位“Transformer”模型的八位發明者之一在不到三年前離開Google,部分原因是Google當時拒絕向公眾開放LaMDA模型。Jeff Dean(左)和 Amin Vahdat(右)在Google的伺服器實驗室 攝影:Scott Hutchinson當 Jeff Dean 坐在沙發上時,他承認Google當時確實判斷失誤。他很高興公司終於克服了對諸如“幻覺”等風險的顧慮——但新的挑戰隨之而來。在Google七個每月使用者超過20億的服務中(包括 Chrome、Gmail 和 YouTube),所有服務都已開始提供基於 Gemini 的功能。Dean表示,他與另一位同事以及 Shazeer(他們三人共同領導了模型的開發工作)必須在團隊們的各種需求中平衡優先順序:流利的日語翻譯、更強的程式設計能力、更好的視訊分析,以幫助 Astra 識別世界的景象。Dean 和 Shazeer 現在常常在 Gradient Canopy 的小型茶水間會面,儘管咖啡研磨機的噪聲不時打擾,他們仍會為各種想法展開討論。Shazeer 表示,他對Google將重點擴展到幫助使用者創造新的AI生成內容這一方向感到興奮。他最近在一檔播客中說道:“整理資訊顯然是一個規模達到數兆美元的機會,但數兆美元已經不夠酷了。現在酷的是 一千兆 美元。”投資者或許也認同這一觀點。Alphabet 的股價從 ChatGPT 發佈幾天後的低點幾乎翻了一倍。最近剛開始同時負責 Hsiao 的 Gemini 應用團隊的 Hassabis 堅稱,公司迎來的復興才剛剛開始,借助 AI 實現像治癒疾病這樣的重大突破指日可待。“我認為,我們擁有目前全世界最廣泛和最深厚的研究基礎,領先所有其他組織一大步,”Hassabis 在接受《連線》(WIRED)採訪時說道。但是,對Google來說,大量令人著迷的研究只有在生成最重要的產出——利潤時才有意義。大多數使用者目前還不願直接為AI功能付費,因此Google可能會考慮在Gemini應用中加入廣告,這當然是Google的經典策略,也是早已在整個矽谷蔓延的模式:把你的資料、時間和注意力交給我們,勾選我們的服務條款,這樣我們就可以免責,而你則免費使用我們建構的“酷工具”。目前,根據Sensor Tower的資料,OpenAI的ChatGPT應用全球累計下載量約為6億,這是GoogleGemini應用下載量1.4億的數倍。此外,這場AI競賽中還有許多其他的聊天機器人——Claude、Copilot、Grok、DeepSeek、Llama、Perplexity——其中許多都由Google的最大競爭對手和資金最充足的公司支援(或者像Claude那樣,甚至是Google自己參與支援的產品)。整個行業——不僅僅是Google——都在為生成式AI系統面臨的共同問題苦惱:這些系統需要數十億美元的投資,但目前仍然無法收回成本,同時還消耗了大量能量,甚至需要重啟幾十年前的燃煤電廠和核反應堆來支援運作。儘管各家公司都聲稱效率每天都在提高,希望能夠減少錯誤,從而贏得更多使用者,但沒有那家公司真正找到了可靠回報的方式,也沒有避免對氣候造成影響的辦法。Google還面臨著競爭對手所沒有的一個挑戰:據摩根大通分析師Doug Anmuth預測,在未來幾年內,Google高達四分之一的搜尋廣告收入可能會因反壟斷判決而流失。公司內部沒有人會忽視填補這一資金缺口的緊迫性。據悉,Hsiao領導的Gemini團隊的一些員工已經連續三年在冬季假期期間加班,以跟上開發節奏。據報導,上個月,Google聯合創始人Sergey Brin對一些員工表示,每周工作60小時是提升生產力、贏得這場日益激烈的AI競賽的“最佳時長”。然而,在接受《連線》(WIRED)採訪的現任和前任員工中,許多人表達了對更多裁員、更嚴重的倦怠以及潛在法律問題的深深擔憂。一位Google研究員和另一位高級同事表示,籠罩公司上下的普遍感受是“不安”。生成式AI的確有實際用途,甚至像法國這樣傾向於監管大型科技企業的政府也正對這項技術的遠大前景態度緩和。在Google DeepMind內部以及公開演講中,Hassabis對他的目標——創造通用人工智慧(AGI)——絕不退讓。這種系統將能夠在人類的大範圍任務中實現類似人類的認知。他偶爾會在周末帶著他的Astra原型機漫步倫敦,體驗這樣一個可能的未來:從泰晤士河上的鴨子到身邊的喬治亞大宅,整個物理世界都將變得可搜尋化。但要實現AGI,系統需要在推理、規劃以及自主行動方面進一步提升。今年1月,OpenAI朝著這一未來邁出了一小步,向公眾開放了另一項實驗:期待已久的“Operator”服務,這是一種超越聊天窗口功能的“代理型AI”(agentic AI)。Operator可以像人一樣在網站上點選和輸入,從而完成預訂旅行或填寫表格等任務。目前,它執行這些任務的速度比人類慢得多,且謹慎許多,同時因其不穩定性成本高昂(作為每月收費200美元計畫的一部分提供)。當然,Google也正在努力為即將推出的模型引入類似的代理型功能。如果說當前的Gemini可以幫助你制定飲食計畫,那麼下一個版本可能會直接將所需食材放入線上購物車中。而再下一個版本,則可能會即時指導你如何切洋蔥。一如既往,快速推進意味著可能會頻繁出錯。今年1月底,在超級碗開始之前,Google發佈了一則廣告,展示Gemini時出現了一個比Bard之前的“望遠鏡”失誤更荒謬的錯誤:它估算地球上消費的奶酪中有一半以上是Gouda奶酪。隨著Gemini從一台“有時可信的事實機器”演變成與人類生活更加親密的夥伴(如人生教練、全方位的助手),Pichai表示Google正在謹慎推進。然而,如今Google終於重新回到行業的頂端,他和其他高管可能再也不希望被競爭對手超越。競賽仍在繼續。 (FuturePulse)