周三,美股傳來消息,蘋果高管 Eddy Cue 在美國司法部的聽證會上宣稱,使用者使用內建在iPhone裡的搜尋功能進行的搜尋次數,首度下降。
消息一出,Google股票應聲下跌,最高達 9%,是當日美股科技七巨頭中跌幅最大的一支。
Google這幾年步履蹣跚,主線搜尋業務群狼環伺,似乎下一步就會被 AI 搜尋取而代之。就在一年多前,Google在 AI 圖片生成上的探索還遭到群嘲。當時,已經整合 Bard 並採用新名字的 Gemini,在使用者生成歷史人物時“過度多元化”,將美國開國元勛,教皇,甚至納粹士兵渲染成深膚色人物。
馬斯克在 2 月 27 日發推,批評Google存在“種族與性別偏見”。
Google現任 CEO 皮查伊 在內部備忘錄中稱此事“令人反感且不可接受”,要求公司在技術和流程上做結構性的改進。
這不是Google第一次在 AI 探索上遭遇滑鐵盧。2022 年,Google大腦團隊公佈了 5400 億參數的 PaLM 模型,刷新參數規模記錄,同時展示Google多年在大模型研究上的深厚積累。但在公司內部,對生成式 AI 的態度依然謹慎。
2022 年 6 月,Google研究員佈雷克·萊莫伊聲稱 LaMDA 模型具有人格,引發輿論風波。Google否認,隨即將其解僱。
在道德上一直身體力行的Google,有了偶像包袱,做事瞻前顧後,事事以“大局為重”。對外界批評格外敏感。
這給了後來者機會。
2022 年 11 月 30 日,名不見經傳的 OpenAI 推出AI 聊天應用 ChatGPT,短短幾天,使用者過百萬。ChatGPT 流暢的對答,廣泛的知識以及創作能力震動了整個科技界。
儘管Google在 AI 上的論文堆積成山,卻在這一刻毫無還手之力,只能看著 OpenAI 一騎絕塵。眼光獨到,很早牽手 OpenAI 的微軟,此時心花怒放。bing 終於有救了。
2022 年 12 月,皮查伊打電話給Google的兩位創始人求助。已經退居二線 3 年多的佩奇和布林回歸,批准了在Google搜尋中加入 AI 聊天機器人的計畫。
2023 年,Bard 立項。皮查伊宣佈了Google歷史上首次大裁員。他砍掉了12000 個崗位,約佔Google總員工數的 6%。
我想起在Google上班的老同學。他的工作狀態令人羨慕。上午 11 點到公司,查郵件,回覆消息,中午在公司吃飯,下午 2 點多下班回家,陪兒子踢球。那時候的Google,堪稱最適宜養老的科技公司之一。
我們在蘋果公司對面的餐館裡吃飯,杯籌交錯,四周瀰漫著一股紙醉金迷的味道。
狼來了,不管你想還是不想。
2023 年 3 月,皮查伊在內部要求團隊“大膽而負責”地加快產品迭代。為了偵錯 Bark 模型,Google幾乎耗盡了一些資料中心的電力冗餘,員工加班成為常態。養老公司成了初創企業。
2023 年 4 月,皮查伊將Google的兩大 AI 團隊Google Brain和 Deepmind 合併,組建新的事業部:Google DeepMind。新事業部致力將Google送上通用人工智慧的發展軌道。
原 DeepMind 主管,現任 Google Deepmind 主管哈薩比斯提議將項目命名為“Titan”,但董事會覺得名字過於張揚。原 Google Brain 主管,現任 Google Deepmind 首席科學家的迪恩建議改稱“Gemini”(雙子座)。
Google Gemini 於是誕生。
2023 年底,Google發佈 Gemini 大模型。Gemini 在標準測試的 32 項任務中,有 30 項任務得分超過 GPT-4。
但 OpenAI 的領先地位依然穩固。
為了異軍突起,Google為 Gemini 開發出突破性的超長上下文窗口。工程師通過讓海量 TPU 晶片高速通訊平行處理,使大模型可以一次處理成千上萬頁文字或者整部視訊。
Gemini 的上下文窗口是當時 ChatGPT 的幾百倍。
為了突出這一優勢,Google研究院的曼尼卡有了想法。他想做一個應用,將長論文自動生成音訊講解,幫助使用者“消化每周arXiv上冒出的海量論文”。
產品幾經雕琢,最後成型,它的名字是 Notebooklm。
Notebooklm 的產品理念相當清晰,開發者只負責建造框架,真正解決問題的能力依靠大模型不斷地演化。
前不久,Notebooklm 的底層模型終於從 Gemini 1.5 升級到了 2.0,文字處理和生成能力得到巨大提升。
我最常用它來對長視訊做筆記,做四維導圖,做內容整理。Notebooklm 的幻覺極低,極少做指定內容來源以外的“聯想”和“推測”。不懂就是不懂。使用者提供的材料裡沒有,就是沒有。
本周,Gemini 發佈大模型的新版,gemini 2.5 pro 0506 preview。新模型在各項測試中屠榜,程式碼生成能力和網頁設計審美達到新的高峰。
它甚至能夠根據視訊,生成一份網頁版解讀。我把油管視訊發給它,在一大段思考之後,它給出了結果。
html 程式碼下載到本地之後,配圖有缺失,但基本要求能滿足。
不僅如此,gemini 高級版悄悄上線了 Veo2,文字生成視訊功能,可以根據提示詞生成 8 秒長的視訊。
以上功能免費使用者都可以享受,Google正在暗中發力。
回到周三蘋果高管的證詞。他的語境是美國司法部對Google涉嫌壟斷的聽證會。這樣的證詞恰好對Google在搜尋上的壟斷地位做了削弱。如果沒有壟斷,是不是就不制裁了?
在能夠預見的將來,iPhone 裡內建的搜尋引擎依然會是Google。Google在 AI 搜尋上的進展也遠比外界想像得深入。
這一個月,我用 Gemini 的時間遠超花了錢的 ChatGPT。Gemini 像任勞任怨的老黃牛,又像不放心孩子的老母親,囉嗦又貼心,不偷懶,不耍滑。
已近中年的Google,還在慢慢變強。 (大個青椒)