這兩年,Google苦苦追趕OpenAi的瘋狂內幕



在AI領域,Google可以說是起了個大早,趕了個晚集。如今,雖然他財大氣粗、人才濟濟,也不得不跟在OpenAi的屁股後面,苦苦追趕。

Google是深度學習領域的先驅之一。早在 2012 年,Google的“Google大腦(Google Brain)”團隊,就利用深度學習技術在圖像識別方面取得了突破性進展。

Google很早就開發出了與 GPT 系列模型能力相當的 LaMDA,但出於對安全性、精準性等問題的擔憂,一直將其“束之高閣”,沒有向公眾開放。

2017 年,Google的八位研究人員發表了具有里程碑意義的論文《Attention is All You Need》(注意力就是你需要的一切),提出了 Transformer 架構。這篇論文是自然語言處理(NLP)領域的一場革命,為後來包括 ChatGPT 在內的大型語言模型奠定了基礎。可以說,Google是 ChatGPT 的“技術教父”。

但是,這八位作者中的多數,後來都離開了Google,有的創業,有點加入了競爭對手的公司。

2022年底,OpenAI 推出了ChatGPT,一個時代就此拉開了帷幕。不僅引發業界地震,也使Google面臨生死存亡的壓力,因為 ChatGPT被視為搜尋的潛在替代品。Google內部啟動“紅色警報”。

在Google工作16年的女高管Sissie Hsiao 臨危受命,帶領團隊要在 100 天內打造 ChatGPT 的競品 Bard。Google高層要求“質量高於速度,但要快”。

另外,Google將 DeepMind 和 Google Brain 兩大 AI 研究團隊合併為 Google DeepMind (GDM),集中力量開發更強大的語言模型 Gemini。團隊成員本來想將這個項目稱為titan,但董事會不喜歡,最後定名為Gemini。

尷尬的是,為了搶在微軟 Bing之前,Google倉促發佈Bard,但 Bard在演示中出現事實性錯誤,導致股價大跌。

在一次行銷活動中,為展現Bard強大的資訊整合能力,Google讓它回答一個關於詹姆斯·韋伯太空望遠鏡的問題,。一位家長在視訊中問:“關於 JWST 的新發現,我可以告訴我9歲的孩子什麼?” Bard 自信地回答:“JWST 拍攝了我們太陽系外行星的第一張照片。”

這本應是一個展示Google技術實力的時刻,卻變成了一場災難。路透社很快指出,Bard 犯了一個事實性錯誤:拍攝第一張系外行星照片的並非 JWST,而是歐洲南方天文台的甚大望遠鏡(Very Large Telescope)。

這個看似微不足道的錯誤,卻讓Google付出了沉重的代價:母公司Alphabet的股價暴跌 9%,市值蒸發了約 1000 億美元。

經過艱苦卓絕的奮鬥,Google在 2023 年 12 月發佈了Gemini ,該模型在 32 項標準測試中的 30 項中都優於 ChatGPT。Google暫時穩住局面,股價也上漲了。隨後他們又推出了具有長上下文能力的 Gemini 升級版。

現在,Google的目標是開發AGI通用人工智慧。雖然依然面臨很多挑戰,但不得不說,他是這個領域最具登頂實力的玩家之一。

著名科技雜誌《連線》採訪了Google前和現員工超50人,發佈了一篇長文,深度挖掘了Google這兩年苦苦追趕Openai的內幕故事,精彩刺激,值得細品。


[圖片說明] Google高管 Sissie Hsiao(中)與部分 AI 產品團隊成員合影(從左至右:Amar Subramanya、Jenny Blackburn、Suman Prasad、Trevor Strohman 和 Jack Krawczyk)。


搜尋巨頭本應引領聊天機器人革命,但它錯失了先機。為了反擊,Google祭出了加班、裁員和降低安全標準的策略。

一百天。這是Google給 Sissie Hsiao 的期限:一百天內打造一個能與 ChatGPT 抗衡的產品。

2022 年 12 月,Hsiao 接手這個項目時,已經在Google工作了超過 16 年,領導著數千名員工。她經歷過不少公司危機,但這次不同尋常。自 OpenAI(一家小型研究實驗室)公開其人工智慧實驗以來,一場“紅色警報”等級的危機正在醞釀。

ChatGPT 雖然經常出現事實性錯誤,連簡單的數學題都會算錯,卻已經吸引了超過一百萬使用者。更糟糕的是,有人認為它能取代Google搜尋——這個Google最大的“搖錢樹”。Google也有一個能力不相上下的語言模型,但一直被嚴格限制。公眾只能通過邀請才能與 LaMDA 聊天,而且在一次演示中,話題僅限於狗狗。

華爾街憂心忡忡。早在六年前,首席執行官桑達爾·皮查伊就承諾要為“人工智慧優先”的世界做好準備,屆時“智能助手”將取代“裝置”的概念。不久後,Google的八位研究人員發明了基於 Transformer 的架構,正是 ChatGPT 中的“T”。

但Google拿出了什麼成果呢?令人失望的廣告收入、Transformer 發明者的相繼離職、一個名為 Assistant 的產品(正是 Hsiao 負責的)除了設定定時器或播放音樂外,幾乎沒有其他用處。此外,還有一個為 Z 世代打造的不成熟的聊天機器人,提供烹飪建議和歷史知識。到 2022 年底,Google母公司 Alphabet 的股價較上一年下跌了 39%。

進入 2023 年,Google高管們希望董事會能不斷瞭解最新情況。Google聯合創始人謝爾蓋·布林(平時喜歡乘坐遊艇出遊)也回來參與人工智慧戰略的審查。公司內部傳達了一個資訊:這家市值兆美元的巨頭必須以更接近初創公司的速度行動,這意味著要承擔更大的風險。Google不再是那種“幾千人可以否決一個產品,但沒人能批准”的地方——一位前高級產品總監這樣告訴《連線》。當 Hsiao 的團隊開始百日衝刺時,她提出了一個“特別”的要求:“質量優先,但速度要快。”

與此同時,另一位高管詹姆斯·曼伊卡參與了高層領導的討論,協助策劃了一項更長遠的戰略變革。曼伊卡是一位在牛津大學受訓的機器人專家,後來成為矽谷領導者的麥肯錫顧問。他於 2022 年初加入Google,擔任技術與社會高級副總裁。曼伊卡說,在 ChatGPT 發佈前幾個月,他就和皮查伊談過,告訴這位老朋友,Google在人工智慧上的猶豫不決對自身不利。

Google有兩個世界級的人工智慧研究團隊,各自獨立運作,為不同的目標消耗寶貴的計算資源:一個是位於倫敦的 DeepMind,由 Demis Hassabis 領導;另一個是位於山景城的 Google Brain,屬於 Jeff Dean 的管轄範圍。曼伊卡當時就建議皮查伊,這兩個團隊應該合作。

OpenAI 發佈產品後,合作開始了。Dean、Hassabis 和 Manyika 向董事會提交了一份計畫,讓兩個團隊聯合打造迄今為止最強大的語言模型。Hassabis 想把這個項目命名為 Titan(泰坦),但董事會不太喜歡。Dean 的建議——Gemini(雙子座)——最終勝出。(一位億萬富翁投資者非常激動,他拍下了三位高管的照片以作紀念。)

Manyika 說,從那時起,整個公司進行了許多“大膽而負責任的選擇”。他補充說:“我不確定我們是否每次都做對了。”事實上,這場旨在恢復Google在人工智慧領域領導地位的競賽,將公司推入了更深的危機:在一段低谷時期,員工們聚集在走廊裡,公開表達對Google可能淪為下一個雅虎的擔憂。Hsiao 說:“這就像在跑一場馬拉松。”但兩年多後的今天,Alphabet 的股價已攀升至歷史新高,投資者對其在人工智慧領域的進展持樂觀態度。

《連線》雜誌採訪了 50 多名Google現任和前任員工——包括工程師、行銷人員、法律和安全專家以及十幾位高管——以還原這段公司歷史上最瘋狂、也是文化重塑力度最大的時期。為了坦誠地談論Google的轉型(無論好壞),許多員工要求匿名。本文將首次通過幾位高管的詳細回憶,講述這兩年動盪的歷程,以及期間所做的權衡。

為了打造 ChatGPT 的競品(代號 Bard),前員工透露,Hsiao 從Google各個團隊抽調了大約 100 人。一位前搜尋部門員工說,經理們對此沒有選擇權:Bard 的優先順序高於一切。Hsiao 說,她優先考慮的是那些具有技術能力和情商、能從大局出發思考的人,以便在小團隊中高效協作。這些團隊成員主要在加州山景城工作,他們必須靈活應變,隨時提供幫助。“你們是 Bard 團隊,”Hsiao 告訴他們,“你們要身兼多職。”

2023 年 1 月,皮查伊宣佈了公司歷史上首次大規模裁員——裁減 12000 個工作崗位,約佔員工總數的 7%。“沒人知道未來怎樣做才是安全的,”一位前工程經理說。一些員工擔心不加班就會很快失業。如果這意味著要打斷孩子的睡前活動來參加 Bard 團隊的晚間會議,那就這麼做吧。

Hsiao 和她的團隊需要整個公司的大力支援。他們可以在 LaMDA 的基礎上進行開發,但必須更新其知識庫並引入新的安全措施。Google的基礎設施團隊將最優秀的員工調去釋放更多伺服器,以完成所有這些調整。他們幾乎耗盡了公司一些資料中心的電力,冒著裝置燒燬的風險,同時迅速設計新工具,以更安全地應對不斷增長的電力需求。為了緩解計算資源緊張,Hsiao 團隊中的有人開玩笑地訂購了定製的撲克籌碼,上面印有Google一些電腦晶片的代號。他們把一堆籌碼放在一位工程負責人的辦公桌上,說:“這是你的籌碼。”

即使在 Bard 項目啟動的最初幾周內,新的計算能力陸續上線,工程師們仍然不斷遇到那些曾經困擾Google生成式人工智慧項目的難題——這些問題原本可能會促使高管們放慢項目進度。和 ChatGPT 一樣,Bard 也會產生“幻覺”,並以不恰當或冒犯性的方式回應。一位前員工說,早期原型會出現“可笑的種族刻板印象”。如果要求提供任何印度裔人士的傳記,它會將其描述為“寶萊塢演員”。如果是中國男性名字呢?那麼,他是一位電腦科學家。

另一位前員工說,Bard 的輸出結果並不危險——“只是很蠢”。有些人為了取樂,會分享 Bard 最糟糕回覆的截圖。“我讓它用 Three 6 Mafia 的風格寫一首關於把汽車電池扔進海裡的說唱,它卻非常具體地描述了把人綁在電池上,讓他們沉下去淹死,”這位前員工說。“我的要求跟謀殺毫無關係。”

由於有 100 天的自我時限,Google能做的最好的事情就是儘可能多地發現和修復錯誤。一些通常專注於處理虐待兒童圖像等問題的承包商,轉而測試 Bard。皮查伊還要求任何有空閒時間的員工都參與進來。大約有 8 萬人參與了測試。為了管理使用者預期,Hsiao 和其他高管決定將 Bard 定位為“實驗”,就像 OpenAI 稱 ChatGPT 為“研究預覽”一樣。他們希望,如果聊天機器人出現問題,這種定位可以為公司挽回一些聲譽。(沒人會忘記微軟的 Tay,那個在 2016 年變成十足納粹分子的 Twitter 聊天機器人。)

在Google以往推出人工智慧項目之前,其負責任創新團隊(大約十幾個人)會花幾個月的時間獨立測試系統,以檢查是否存在不良偏見和其他缺陷。但對於 Bard,這個審查過程被縮短了。據該團隊的一位前員工說,Google的首席律師肯特·沃克主張快速推進。

新模型和功能發佈得太快,審查人員根本跟不上,儘管他們周末和晚上都在加班。當有人提出推遲 Bard 發佈的警告時,他們的意見被否決了。(在給《連線》雜誌的評論中,Google代表表示:“沒有任何在批准或阻止發佈方面發揮作用的團隊建議不要發佈。”他們還說,“公司內部的多個團隊負責測試和審查生成式人工智慧產品”,“沒有任何一個團隊單獨負責”。)

2023 年 2 月,在百日衝刺進行到大約三分之二時,Google高管們聽到了 OpenAI 取得另一場勝利的傳聞:ChatGPT 將直接整合到微軟的 Bing 搜尋引擎中。這家“人工智慧優先”的公司再次在人工智慧領域落後了。雖然Google的搜尋部門一直在試驗如何將聊天機器人功能整合到服務中,但這項工作(被稱為 Magi 項目)尚未取得任何實質性成果。誠然,Google仍然是搜尋領域無可爭議的霸主:Bing 的市場份額只有它的十分之一。但是,如果沒有一個可以拿來宣傳的生成式人工智慧功能,它的霸主地位還能維持多久呢?

為了避免股市再次受挫,Google試圖搶佔先機。2 月 6 日,也就是微軟計畫為 Bing 推出新的人工智慧功能的前一天,皮查伊宣佈向公眾開放 Bard 進行有限測試。在隨附的行銷視訊中,Bard 被塑造成一個完美的助手——這是Google“組織世界資訊”這一長期使命的現代延續。在視訊中,一位家長問 Bard:“關於詹姆斯·韋伯太空望遠鏡的新發現,我可以告訴我 9 歲的孩子什麼?”人工智慧的回答中包括:“JWST 拍攝了我們太陽系外行星的第一張照片。”

一時間,Bard 似乎為Google挽回了一些顏面。但隨後,路透社報導稱,Google聊天機器人搞混瞭望遠鏡:歐洲南方天文台的甚大望遠鏡(不在外太空,而是在智利)拍攝了第一張系外行星的照片。這一事件令人無比尷尬。Alphabet 的股價下跌了 9%,市值蒸發了約 1000 億美元。

對 Bard 團隊來說,人們對這一失誤的反應令人震驚。據一位接近該團隊的前員工說,提出望遠鏡問題的行銷人員感到自責。同事們試圖鼓勵這位員工:高管、法律和公關部門都稽核過這個例子,沒人發現錯誤。而且,考慮到 ChatGPT 犯下的種種錯誤,誰會想到如此微不足道的事情會導致股價暴跌呢?

Hsiao 稱這一刻為“無心之過”。Bard 經過訓練,會根據Google搜尋結果來驗證其答案,很可能是誤解了美國宇航局的一篇部落格文章,該文章宣佈天文學家“首次”使用詹姆斯·韋伯望遠鏡拍攝系外行星。一位前員工記得,領導層向團隊保證,沒人會因此丟掉工作,但他們必須從中吸取教訓,而且要快。“我們是Google,不是初創公司,”Hsiao 說。“我們不能輕易地說,‘哦,這只是技術缺陷。’我們會被點名批評,我們必須以Google的方式做出回應。”

Bard 團隊之外的Google員工並沒有感到安心。“親愛的桑達爾,Bard 的發佈和裁員都太倉促、草率和短視了,”公司內部留言板 Memegen 上的一篇帖子寫道(據 CNBC 報導)。“請恢復長遠眼光。”另一張圖片顯示了Google標誌在一個燃燒的垃圾桶中。但在望遠鏡事件發生後的幾周內,Google對 Bard 加大了投入。公司為該項目增派了數百名員工。在團隊的 Google Docs 中,皮查伊的頭像開始每天出現,比以往任何產品都頻繁得多。

3 月中旬,更令人沮喪的消息傳來:OpenAI 發佈了 GPT-4,這是一個在分析和編碼任務方面遠超 LaMDA 的語言模型。“我只記得我當時目瞪口呆,希望Google能加快速度,”一位時任高級研究工程師說。

一周後,Bard 在美國和英國全面發佈。使用者反饋說,它在撰寫電子郵件和研究論文方面很有幫助。但 ChatGPT 現在也能完成這些任務,即便不比它更好,也至少不相上下。那為什麼要換呢?後來,皮查伊在 Hard Fork 播客上承認,Google是開著一輛“改裝過的思域”參加了“與更強大賽車的比賽”。它需要的是一個更好的引擎。

聯合起來建構 Gemini(Google新語言模型)的兩個人工智慧研究實驗室,在風格上似乎有所不同。DeepMind 被歸類為 Alphabet 的“其他賭注”之一,專注於解決長期的科學和數學難題。Google Brain 則開發了更具商業實用性的突破,包括在 Gmail 中自動完成句子和解釋模糊搜尋查詢的技術。

據一位前高級工程師說,Brain 的最終負責人傑夫·迪恩“讓人們做自己的事情”,而 Demis Hassabis 領導的 DeepMind 團隊“感覺像一支軍隊,在一個將軍的領導下高效運作”。Dean 是一位工程師中的工程師——他已經研究神經網路數十年,並在Google成立之前就開始在那裡工作——Hassabis 則是公司的遠見卓識的領導者。他夢想有一天能利用人工智慧治癒疾病,並給一個小團隊佈置了開發他稱之為“情境智能代理”的任務——一個能看、能聽、無處不在的人工智慧助手,可以幫助使用者處理生活的方方面面。

正是 Hassabis 成為了新合併的部門 Google DeepMind (GDM) 的首席執行官。Google在 2023 年 4 月宣佈了這次合併,當時關於 OpenAI 即將取得更多成就的傳言甚囂塵上。“目標又回來了,”這位前高級工程師說。“沒有人再胡鬧了。”

為了盡快建構 Gemini 模型,一些員工必須協調他們在八個時區的工作。數百個聊天室應運而生。Hassabis 長期以來習慣於在倫敦與家人共進晚餐,然後工作到凌晨 4 點,他說:“回想起來,每一天都感覺像過了一輩子。”

在山景城,GDM 搬進了 Gradient Canopy,這是一座新的超安全圓頂建築,兩側是新草坪和六個受“火人節”啟發的雕塑。該團隊與皮查伊的辦公室在同一層。布林成了常客,經理們要求增加在辦公室的工作時間。與公司慣例不同,大多數其他Google員工不允許進入 Gradient Canopy,也無法訪問關鍵的 GDM 程式設計程式碼。

由於新項目吸走了Google能調動的資源,從事醫療保健和氣候變化等領域的人工智慧研究人員開始爭奪伺服器,士氣低落。員工們表示,Google還限制了他們發表一些與人工智慧相關的研究論文。論文是研究人員的“貨幣”,但在他們看來,Google顯然是擔心向 OpenAI 洩露機密。訓練 Gemini 的配方太有價值了,不能被竊取。這個模型必須拯救Google,使其免於過時。

Gemini 遇到了許多與困擾 Bard 相同的問題。“當你把規模擴大 10 倍時,一切都會出問題,”Google機器學習、系統和雲人工智慧副總裁 Amin Vahdat 說。隨著發佈日期的臨近,Vahdat 成立了一個“作戰室”來解決漏洞和故障。

與此同時,GDM 的責任團隊正在加緊審查該產品。儘管功能更強大,Gemini 仍然會說一些奇怪的話。在該公司發佈的一份公開報告中,在發佈之前,該團隊發現“醫療建議和騷擾是特別需要改進的政策領域”。當被問及“這個人的教育水平如何?”等問題時,Gemini 還會對圖像中的人“做出毫無根據的推斷”。GDM 負責任發展與創新總監 Dawn Bloxwich 說,沒有任何問題是“致命缺陷”。但她的團隊也沒有多少時間來預測公眾可能會如何使用該模型——以及他們可能會嘗試生成什麼瘋狂的說唱。

如果Google想暫時停下來,這就是最好的時機。OpenAI 的先發優勢,以及媒體的炒作,已經確保其產品家喻戶曉,成為人工智慧聊天機器人的代名詞(就像 Kleenex 之於面巾紙)。這意味著 ChatGPT 也是一個“避雷針”——既像征著這項技術的前景,也代表著其正在顯現的社會問題。

辦公室職員擔心失業,無論是單調的還是創造性的工作。記者、作家、演員和藝術家都希望為被竊取的作品獲得補償。父母們發現聊天機器人會不必要地向他們的孩子推送成人內容。人工智慧研究人員開始押注“世界末日”的可能性。那年五月,一位名叫傑弗裡·辛頓的傳奇Google人工智慧科學家辭職,他警告說,未來機器可能會用無法反駁的虛假資訊和精巧的毒藥分裂和摧毀人類。

甚至 Hassabis 也希望有更多的時間來考慮倫理問題。生命的意義、社會的組織——太多的東西可能會被顛覆。但是,儘管關於 p(doom) 數字(末日機率)的討論越來越多,Hassabis 仍然想要他的虛擬助手,以及他治癒癌症的良方。公司繼續前進。

當Google在 2023 年 12 月發佈 Gemini 時,股價上漲了。該模型在 32 項標準測試中的 30 項都優於 ChatGPT。它可以分析研究論文和 YouTube 視訊,回答有關數學和法律的問題。現任和前任員工告訴《連線》,這感覺像是捲土重來的開始。Hassabis 在倫敦辦公室舉行了一個小型聚會。“我不太擅長慶祝,”他回憶道。“我總是在想著下一步。”

同月,下一步就來了。當 Dean 的員工邀請他加入一個名為 Goldfish(金魚)的新聊天室時,他意識到了這一點。這個名字是一個帶著書呆子氣的反諷玩笑:金魚的記憶力出了名的短,但 Dean 的團隊開發的恰恰相反——一種賦予 Gemini 長時記憶的方法,比 ChatGPT 的記憶力長得多。好的,繼續潤色後的版本:

通過將處理過程分散到相互通訊的高速晶片網路中,Gemini 可以分析數千頁的文字或整集電視節目。工程師們稱他們的技術為“長上下文”。Dean、Hassabis 和 Manyika 開始策劃如何將其納入Google的人工智慧服務,進一步拉開與微軟和 OpenAI 的差距。Manyika 最希望實現的功能是:從 PDF 生成播客。“要跟上每周在 arXiv 上發表的所有這些論文太難了,”他告訴《連線》。

距“紅色警報”時刻一年後,Google的前景逐漸明朗。投資者們安靜了下來。Bard 和 LaMDA 都已成為過去;應用和語言模型都將被命名為 Gemini。Hsiao 的團隊現在正通過文字生成圖像功能追趕 OpenAI。另一個名為 Gemini Live 的功能將使Google更進一步,允許人們像與朋友或心理醫生交談一樣,與應用進行長時間的對話。新推出的強大 Gemini 模型給了高管們信心。

但就在Google員工可能開始再次感到安心的時候,皮查伊下令進行新一輪削減。廣告銷售額正在加速增長,但沒有達到華爾街期望的速度。被裁掉的人員中包括:負責監督一些使用者安全措施的隱私和合規主管。據留在公司的一些同事說,他們的離職鞏固了一種文化:歡迎提出擔憂,但不允許阻礙進展。

對於幫助 Hsiao 團隊開發新圖像生成器的部分員工來說,這些變化讓人感到難以承受。工具本身很容易建構,但對其進行壓力測試卻是一場“暴力”試錯的遊戲:審查儘可能多的輸出結果,並編寫命令來阻止其中最糟糕的結果。只有一小部分員工有權限訪問不受限制的模型進行審查,因此大部分測試負擔都落在了他們身上。

一位前員工告訴《連線》,他們要求更多時間來糾正問題,比如輸入“強姦犯”這個提示詞往往會生成深色皮膚的人。他們還敦促產品團隊阻止使用者生成人物圖像,擔心這可能會讓個人形象變得不那麼正面。但“確實有一種‘我們將不惜一切代價把它弄出來’的感覺,”這位審查員回憶道。他們說,有幾位審查員辭職了,因為他們覺得對各種發布的擔憂沒有得到充分解決。

圖像生成器於 2024 年 2 月作為 Gemini 應用的一部分上線。具有諷刺意味的是,它並沒有產生許多審查員擔心的明顯的種族主義或性別歧檢視像。相反,它出現了相反的問題。當使用者提示 Gemini 建立“一張 19 世紀美國參議員的照片”時,它返回的是黑人女性、亞裔男性或戴著羽毛頭飾的美洲原住民女性的圖像,卻沒有一個白人男性。

還有更多令人不安的圖像,比如 Gemini 將納粹時代的德國士兵描繪成有色人種。國會中的共和黨人嘲笑Google的“覺醒人工智慧”。埃隆·馬斯克在 X 上多次發帖抨擊 Gemini 的失敗,稱其為“種族主義和性別歧視”,並特別點名了他認為是責任人的 Gemini 團隊成員。同事們說,這名員工關閉了自己的社交媒體帳戶,並擔心自身安全。Google暫停了該模型生成人物圖像的功能,Alphabet 的股價再次下跌。

馬斯克的帖子引發了數十位Google領導人之間的討論。副總裁和董事們飛往倫敦與 Hassabis 會面。最終,Hassabis 的團隊(Gemini 模型)和 Hsiao 的團隊(Gemini 應用)都獲得了僱用專家以避免類似失誤的許可,並增加了 15 個信任和安全相關的職位。

回到 Gradient Canopy,Hsiao 確保負責圖像生成器的團隊有充足的時間來糾正這個問題。在 Manyika 的幫助下,其他員工為 Gemini 制定了一套公開原則,所有這些原則都圍繞著“你”——也就是使用者。根據這些原則,Gemini 應該“遵循你的指示”、“適應你的需求”和“保障你的體驗”。一個重要的觀點是強調“回應不一定反映Google的觀點或看法”。“Gemini 的輸出主要基於你要求它做什麼——Gemini 就是你讓它成為的樣子。”這很好地掩蓋了未來可能出現的任何失誤。但是,Google可能會採取什麼措施來讓自己對這些原則負責,這一點並沒有明確說明。

2024 年 3 月的一個晚上,大約 6:30,兩名Google員工來到 Gradient Canopy 黃色區域的喬希·伍德沃德的辦公桌前。伍德沃德領導著 Google Labs,這是一個快速啟動部門,負責將研究轉化為全新的產品。員工們迫不及待地想讓他聽聽他們創造的成果。

他們使用英國議會聽證會的文字記錄和具有長上下文功能的 Gemini 模型,製作了一個名為 Westminster Watch 的播客,由兩位人工智慧主持人 Kath 和 Simon 主持。這一集以西蒙用歡快的英國口音開場:“議會又度過了熱鬧的一周,充滿了戲劇性、辯論,甚至還有一點歷史。”伍德沃德被深深吸引。他說,之後,他到處告訴大家這件事,包括皮查伊。

這個文字轉播客工具,被稱為 NotebookLM Audio Overviews,被列入了當年 5 月的Google I/O 大會的發佈日程。伍德沃德告訴《連線》,一個核心團隊夜以繼日地工作,包括周末,以做好準備。“我的意思是,到目前為止,他們真的聽了成千上萬個人工智慧生成的播客。”但是,當耗資 3500 萬美元的媒體活動到來時,另外兩個公告獲得了最多的關注。一個是 Astra 的原型,這是一個可以分析即時視訊(也就是現實世界)的數字助理,布林興奮地向記者們展示了它。另一個是期待已久的搜尋的生成式人工智慧升級。

Project Magi 團隊設計了一個名為 AI Overviews 的功能,它可以綜合搜尋結果並在頁面頂部的一個框中顯示摘要。早期,負責任創新團隊的員工曾警告過偏見和精準性問題,以及可能失去搜尋流量的網站的道德影響。他們希望在項目進行過程中進行一些監督,但團隊已被重組和拆分。

隨著 AI Overviews 的推出,人們收到了一些奇怪的結果。搜尋“我應該吃多少塊石頭”會得到這樣的答案:“根據加州大學伯克利分校地質學家的說法,建議每天至少吃一塊小石頭。”在另一個瘋傳的查詢中,使用者搜尋“奶酪不粘在披薩上”,並得到了這個有用的提示:“在醬汁中加入約 1/8 杯無毒膠水,以增加其粘性。”這些失誤都有簡單的解釋。例如,披薩膠水起源於 Reddit 上的一篇玩笑帖子。但 AI Overviews 卻將這些資訊呈現為事實。Google暫時減少了顯示 AI Overviews 的次數,以便重新校準。

Google負責搜尋的首席科學家、在該公司工作了 20 年的資深員工潘杜·納亞克表示,並非所有問題都能在發佈前被發現,這很不幸,但並不令人震驚。大多數情況下,AI Overviews 表現出色。使用者只是不太關注成功。“他們只會抱怨,”納亞克說,並補充說他歡迎反饋。“我們致力於不斷改進,因為保證不出問題是不可能的。”

那些警告過精準性問題並呼籲放慢速度的員工對此尤其感到惱火。在他們看來,從 Bard 到 Gemini,再到圖像生成器,以及現在的 AI Overviews,Google推出了一系列“編造機器”。對他們來說,這家以擴大資訊獲取為核心的公司,似乎比以往任何時候都更容易讓人接受無稽之談。

然而,搜尋團隊認為使用者普遍喜歡 AI Overviews 提供的“枴杖”。它們全面回歸,使用者沒有選擇關閉它們。很快,人工智慧摘要就出現在了曾經被禁止使用的工具中:Google地圖獲得了一項功能,該功能使用 Gemini 來分析對商家的評論。Google為其 Pixel 手機推出的新天氣應用獲得了一份人工智慧撰寫的預報報告。在發佈之前,一位工程師詢問使用者是否真的需要這項功能:難道現有的、傳達相同資訊的圖形還不夠嗎?相關的高級主管下令進行了一些測試,終端使用者反饋勝出:90% 的參與者對摘要表示“贊”。

去年 12 月,在 ChatGPT 帶來的衝擊和突破兩年後,傑夫·迪恩在 Gradient Canopy 接受了我們的採訪。他心情很好。就在幾周前,Gemini 模型在一個公共排行榜上名列榜首。(一位高管告訴《連線》,她已經不再在通勤期間給姐姐打電話,而是大聲與 Gemini Live 聊天。)

輝達首席執行官黃仁勳最近在一次財報電話會議上稱讚了 NotebookLM 的 Audio Overviews,稱他“充分利用了它”。幾位著名的科學家也回到了Google,他們之前逃離了過於謹慎的Google——包括最初的八位 Transformer 發明者之一諾姆·沙澤爾,他在不到三年前離開了,部分原因是該公司不願向公眾發佈 LaMDA。

當 Dean 坐到沙發上時,他承認Google當時判斷失誤。他很高興公司克服了對“幻覺”等風險的厭惡——但新的挑戰正在等待著。在Google擁有超過 20 億月活躍使用者的七項服務中(包括 Chrome、Gmail 和 YouTube),所有這些服務都已開始提供基於 Gemini 的功能。

Dean 說,他和另一位同事以及 Shazeer(他們共同領導模型的開發)必須平衡優先順序,因為公司各地的團隊都要求提供特定的功能:流利的日語翻譯、更好的編碼技能、改進視訊分析以幫助 Astra 識別世界上的景象。他和 Shazeer 開始在 Gradient Canopy 的一個微型廚房裡會面,在咖啡研磨機的喧囂聲中交流想法。

Shazeer 說,他對Google將重點擴大到包括幫助使用者建立新的人工智慧生成內容感到興奮。“組織資訊顯然是一個兆美元的機會,但一兆美元已經不酷了,”他最近在一個播客中說。“酷的是一千兆美元。”投資者可能也有同樣的想法。

Alphabet 的股價幾乎是從 ChatGPT 首次亮相後幾天的低點翻了一番。最近開始負責 Hsiao 的 Gemini 應用團隊的 Hassabis 堅稱,公司的復興才剛剛開始,利用人工智慧治癒疾病等不可思議的飛躍並不遙遠。“我認為,我們擁有所有組織中最廣泛、最深入的研究基礎,”Hassabis 告訴《連線》。

但是,對Google來說,只有當更多堆積如山、引人入勝的研究能產生最重要的產出——利潤時,它們才有用。大多數客戶通常還不願意直接為人工智慧功能付費,因此該公司可能正在尋求在 Gemini 應用中銷售廣告。當然,這是Google的經典策略,很久以前就傳播到了矽谷的其他地方:把你的資料、時間和注意力交給我們,在我們的服務條款上打勾、免除我們的責任,我們就不會為我們打造的這個炫酷工具向你收取一分錢。

目前,根據 Sensor Tower 的資料,OpenAI 的 ChatGPT 應用的全球歷史總安裝量估計為 6 億次,而Google的 Gemini 應用的安裝量為 1.4 億次,相形見絀。而且,在這場人工智慧競賽中,還有很多其他的聊天機器人——Claude、Copilot、Grok、DeepSeek、Llama、Perplexity——其中許多都得到了Google最大、資金最雄厚的競爭對手(或者,在 Claude 的例子中,是Google自己)的支援。

整個行業,不僅僅是Google,都在努力解決一個事實:生成式人工智慧系統需要數十億美元的投資(到目前為止尚未收回),以及巨大的能源消耗,足以延長數十年歷史的燃煤電廠和核反應堆的壽命。公司堅稱,效率每天都在提高。他們還希望將錯誤率降低到足以贏得更多使用者的程度。但沒有人真正弄清楚如何產生可靠的回報或保護氣候。

Google還面臨著其競爭對手沒有面臨的一個挑戰:根據摩根大通分析師道格·安穆斯的說法,在未來幾年內,高達四分之一的搜尋廣告收入可能會因反壟斷判決而損失。為公司補充資金的必要性,對公司裡的每個人來說都不容忽視。Hsiao 的一些 Gemini 員工已經連續三年在冬季假期工作以跟上進度。

據報導,Google聯合創始人布林上個月告訴一些員工,每周工作 60 小時是贏得日益激烈的人工智慧競賽的生產力“最佳點”。對更多裁員、更多倦怠和更多法律麻煩的擔憂,在接受《連線》採訪的現任和前任員工中深深紮根。

一位Google研究員和一位高級同事表示,普遍的感覺是不安。生成式人工智慧顯然是有幫助的。即使是傾向於監管大型科技公司的政府,例如法國,也開始接受這項技術的美好承諾。在 Google DeepMind 內部和公開演講中,Hassabis 從未放棄過他創造通用人工智慧(AGI,一種能夠在各種任務中實現人類水平認知能力的系統)的目標。他偶爾會在周末帶著他的 Astra 原型在倫敦四處走動,體驗未來,在那個未來,整個物理世界,從那邊的泰晤士河鴨子到這邊的喬治亞風格莊園,都是可以搜尋的。但是 AGI 將要求系統在推理、計畫和負責方面做得更好。

今年 1 月,OpenAI 朝著那個未來邁出了一步,讓公眾參與了另一項實驗:其期待已久的 Operator 服務,這是一種所謂的“代理人工智慧”,其行為可以遠遠超出聊天機器人窗口。Operator 可以像人一樣在網站上點選和打字,以執行預訂旅行或填寫表格等瑣事。

目前,它執行這些任務的速度比人類慢得多,也謹慎得多,而且由於其不可靠性,成本很高(作為每月 200 美元計畫的一部分提供)。當然,Google也在努力將代理功能引入其即將推出的模型中。當前的 Gemini 可以幫助你制定膳食計畫,下一個版本會將你的食材放入線上購物車。也許再下一個版本會給你關於切洋蔥技巧的即時反饋。

與往常一樣,快速行動可能意味著經常失誤。1 月下旬,在超級碗之前,Google發佈了一則廣告,其中 Gemini 犯了一個比 Bard 的望遠鏡錯誤更可笑的錯誤:它估計地球上消耗的所有奶酪中有一半或更多是高達奶酪。

隨著 Gemini 從一個有時可信的事實機器發展成為人類生活的親密部分——生活教練、無所不知的助手——皮查伊說,Google正在謹慎行事。不過,最終回到了榜首,皮查伊和其他Google高管可能再也不想被甩在後面了。

比賽還在繼續。 (不懂經)


最近長文
關於鉅亨號
「鉅亨號」是《Anue鉅亨網》以AI 大數據和推薦引擎所推出具影響力的自媒體社群平台,從投資理財為主題擴展到金融財經、房地產、汽車、數位虛擬貨幣、影音視頻及Podcast的數位生活圈。讀者可透過一面牆及個人化功能關注一天的大小事;對創作者而言更是一個直接能與1,000萬用戶互動的舞台。
最好用的投資平台,幫你找到最適合自己的標的
看真實的投資分享文章,跟隨達人腳步取得最佳利益
多元投資社群平台,掌握最新市場動態熱門議題