1000億天價,祖克柏買下「半個天才」和 Meta AI 的未來

不僅是大模型本身,Meta 也要成為 AI 基建大廠。

「21 世紀最貴的是什麼?人才!」

多年前葛優在《天下無賊》裡台詞的含金量,還在不斷提升。

當地時間 6 月 10 日,媒體曝光 Meta 將以 149 億美元的價格收購 Scale AI 49% 的股權,而後者的聯合創始人 Alexandr Wang,將成為 Meta 新成立的「超級智能小組」的掌門。

按照股權比推算,此次交易 Wang 和團隊有可能獲得 74 億美元,堪稱是矽谷成本最高的「挖角」——要知道,Google在 2014 年收購 DeepMind 團隊不過 6 億美元。

祖克柏在內部信中寫道:「我們將共同建構 AI 的未來。」在 Llama 4 模型折戟、AI 團隊人員不斷流失的現實下,Meta 此次大舉押注 Scale AI,圖的是什麼?有了 Scale AI 和 Alexandr Wang,Meta 能在接下來的 AI 大戰中,重新找到自己的位置嗎

01. 最貴的「搖擺人」

作為 AI 時代矽谷躥升最快的公司,Scale AI 的估值一直以火箭速度躥升,短短 5 年時間就膨脹至 138 億美元。然而,此次 Meta 收購前者 49% 的股權,就需要付出 149 億美元的成本。

49% 顯然是為了反壟斷審查考慮,但 Meta 和祖克柏想要的,是聯合創始人之一 Alexandr Wang 這個人——這位 19 歲創業的天才將成為 Meta 新成立的超級智能實驗室的負責人,帶領 Meta AI 進入新時代。

有意思的是,說 Meta 徹底買下 Wang 並不確切,因為 Wang 將繼續擔任 Scale AI 的 CEO一職,代表 Wang 和 Scale AI 還將繼續保持「獨立」,這可能也是歷史上成本最高的「腳踏兩隻船」,而 Scale AI 如果保持增長勢頭,Wang 則可能成為矽谷身家增長最快的創業者,沒有之一。

祖克柏如此急不可耐地、以 Meta 以罕見的金額出手押注 Scale AI 和 Wang,體現出的是他因 Meta 在 AI 競賽中逐漸掉隊的焦慮。

儘管 Meta 在 2024 年推出了參數規模達 1.8 兆的 Llama 4 Behemoth,但其在多模態理解、長文字推理等關鍵指標上仍落後 GPT-4.5 約 12%。更尷尬的是,Llama 訓練資料的質量問題被曝光:業內估算約 30% 的語料來自低品質社交媒體內容,導致模型頻繁輸出錯誤資訊。

剛剛成立 2 年後的 Scale AI 團隊,最左側為 Wang 本人|圖片來源:Scale AI

我們缺的不是算力,是乾淨的資料和頂尖工程人才。」一位 Meta AI 研究員匿名吐槽。這解釋了為何祖克柏要砸重金請來 Wang——一個以資料標註技術聞名的「基建狂魔」。

作為估值最高的資料標註公司,Scale AI 的躥紅不是沒有道理。根據報導,Scale AI 的護城河在於其將原始資料轉化為 AI 可用燃料的能力:

軍事級標註精度:通過混合人類標註員+AI 質檢的「雙保險」,其資料錯誤率僅 0.3%,而行業平均為 5%(公司自述)。

多模態資料壟斷:擁有全球最大的視訊動作標註庫(含 1.2 億條人體動作資料)和跨語言文字資料集(覆蓋 217 種語言)。

而事實上,花 149 億美元巨資買下「半個」Scale AI 和 Wang 本人,Meta 的野心不僅僅在於 AI 大模型本身。

02. 轉型 AI 基建,彌補 B 端短板

資料、算力和模型,是大模型領域的三要素,Meta 作為社交巨頭,在資料和算力上有著天然優勢,不過在「資料」上需要打個引號,因為 Meta 的資料量雖然大,但如果質量不行,對於 AI 模型訓練作用不大。

你們看到的每個 GPT 回覆,背後都有我們標註的 500 個資料點。」Wang 的這句話,解釋了 Meta 的焦慮。當 OpenAI 用 Scale AI 的資料訓練出更聰明的模型時,Meta 卻困在自家社交資料的孤島裡。收購 Scale AI,等於直接接管了競爭對手的「彈藥庫」。

Scale AI 手握全球 35% 的 AI 訓練資料流量,服務著從五角大樓到 OpenAI 的頂級客戶。Meta 研究院的工程師私下吐槽:「我們用 Llama 3 訓練時,30% 算力浪費在清洗垃圾資料上,而 Scale AI 的標註精度能達到 99.7%。」

有了 Scale AI 精準的資料清洗和標註,業內估計 Meta 將訓練資料污染率從 15% 降至 2%,下一代 Llama 5 的訓練周期縮短 40%。知情人士透露,正在測試的「Llama 5 Behemoth」參數規模達 3 兆,專門用於攻克 AGI。

同時,Scale AI 的標註系統已深度適配 Meta 定製 AI 晶片架構,形成「資料標註-模型訓練-硬體最佳化」閉環,有可能使 Llama 模型推理成本降低至 GPT-4o 的 1/3。

可以說,引入 Scale AI 後,Meta 的 Llama 模型從訓練質量、效率和成本上都將獲得大幅最佳化。

事實上,Scale 的接入,甚至可能重塑 Meta 在 AI 競爭中的整個戰略。相比於 Google 和微軟,缺少雲端運算平台的 Meta 一直只能在 C 端撒野。而有了 Scale 的能力,Meta 計畫通過 AWS/Azure 等雲平台對外提供 Scale AI 資料服務,建構類似微軟「Copilot+OpenAI」的生態閉環,將競爭對手轉化為客戶

如果說資料是新時代的石油,那麼 Meta 通過購買 Scale AI 這家份額最大的「資料精煉廠」,已經掌握了大半個 AI 基建體系。

Meta 在 AI 競爭中逐漸掉隊|圖片來源:Meta

當然,OpenAI、Anthropic 等競爭對手到底會不會買帳目前仍未可知,雖然 Meta 僅僅買下半個 Scale AI(和半個 Wang),但顯然已經足夠讓前者警惕 Scale AI 的中立地位,所以 openAI 也在加緊和 Scale AI 的競爭對手 Handshake 合作。

不過,鑑於 Scale AI 在資料標註方面的壓倒性優勢,OpenAI 等公司要想馬上和 Scale AI 斷聯,也不太現實。至少在短期內,AI 巨頭們依然需要 Scale AI 的服務。

即便 Scale AI 之前的客戶們逐漸減少下單,Meta 和 Scale AI 已經謀劃新的收入來源——政府和國防客戶。根據報導,Scale AI 合作,已經獲得來自美軍方超過 2 億美元的政府訂單。同時,Scale AI 本身也在向國防定製等垂直領域的 AI 應用層擴展,而 Meta 的企業級銷售能力和背書,無疑會對 Scale AI 未來的發展提供足夠動力。

業內人士傳言,Meta 和 Scale AI 的巨額交易還有一個隱藏對賭:若Scale AI 未來三年收入增速低於 80%,Meta 有權以折扣價收購剩餘股份——這代表 Wang 不僅要「讓 Meta AI 再次偉大」,同時自己的 Scale AI 在收入上也要繼續高速增長。而 B 端業務顯然會成為雙方的新增速來源。

對於 Meta 團隊,Wang 即便作為「腳踏兩隻船」的超級智能實驗室負責人加入,也能產生極強的「鯰魚效應」。在矽谷 AI 界,Meta 向來以學術氛圍濃厚著稱,Llama 的開源和普惠正是其學術思考的結果。但 Wang 極力推崇的「資料思維」無疑將對 Meta 現有的 AI 團隊產生衝擊和改變。

根據媒體報導,Wang 剛剛加入 Meta,反手就砍掉三個學術項目,推動團隊向更「現實」的方向轉型。

如果不考慮反壟斷的阻撓,此次 Meta 對於 Scale AI 和 Wang 本人的巨額押注,可能重塑 Meta 在激烈的 AI 競爭中的角色和發展方向,不僅讓 Meta 快速縮短和競爭對手在模型領域的差距,更能使這個社交巨頭,完成從應用到 AI 基建角色的轉變。

這場豪賭的本質,是 Meta 試圖用資本力量重寫 AI 競爭規則。正如矽谷分析師 Sarah Guo 所言:「當所有人都在造車時,Meta 買下了整條高速公路——不管車上坐的是誰,都得交過路費。」 (極客公園)