Meta押注“超級智能”:Muse Spark橫空出世,祖克柏打響AI翻身仗

祖克柏曾公開承認自己對Meta AI進度不滿意,並下定決心啟動一場全面革新。

在沉寂了將近一年之後,Meta終於端出了一道讓行業側目的大菜。

4月8日,Meta正式發佈旗下最新旗艦AI模型 Muse Spark,將其定性為“從零開始的全面改造”——這是Meta全新成立的超級智能實驗室(Meta Superintelligence Labs,下稱MSL)對外發佈的首個公開模型,也是祖克柏為重奪AI桌上一席之地而打出的最重要一張牌。

Muse Spark的誕生,是Meta對自身AI戰略一次徹底的自我否定與重構。

過去兩年,Meta在AI賽道上的形象相當尷尬:Llama系列雖然憑藉開源策略在生態圈積累了口碑,但無論是產品完成度還是模型性能,都被OpenAI的ChatGPT、Anthropic的Claude遠遠甩在身後。祖克柏曾公開承認自己對Meta AI進度不滿意,並下定決心啟動一場全面革新。

過去9個月裡,Meta重建了整個AI技術堆疊,包括訓練基礎設施、推理架構和資料策略。Muse Spark不是在舊基礎上修修補補,而是真正意義上的“新生”。用Meta自己的話說,這是“我們擴展階梯的第一步”——言下之意,Muse系列之後還有更多。

新大腦,新團隊

重建的不只是技術,還有人。

去年,Meta宣佈成立超級智能實驗室,並以143億美元投資入股AI資料公司Scale AI,獲得49%股權,並任命Scale AI創始人Alexandr Wang 擔任Meta首席AI官,主導這場重建工程。與此同時,Meta從OpenAI、Anthropic、Google大批挖角頂尖研究人員,以業界罕見的薪酬體系重組了AI核心團隊。

這一系列動作的訊號再明確不過:祖克柏要玩真的了。

從獨立第三方評測機構Artificial Analysis的資料來看,Muse Spark在綜合智力指數(Intelligence Index)上得分52,全球排名前五,僅次於GoogleGemini 3.1 Pro Preview、OpenAI GPT-5.4和Anthropic Claude Opus 4.6,大幅超越Meta此前最強模型Llama 4 Maverick(18分)。

具體能力維度上:

  • 視覺理解(MMMU-Pro):得分80.5%,全球第二,僅次於Gemini 3.1 Pro Preview的82.4%;
  • 推理與指令遵循(HLE評估):得分39.9%,位居第三;
  • 科學推理(CritPT物理研究題):得分11%,超越Claude 4.6 Sonnet(3%)和Gemini 3 Flash(9%);
  • “人類終極考試”(Humanity's Last Exam):借助外部工具時達到58.4分的高水準。

值得關注的是,Muse Spark在達到頂尖性能的同時,Token消耗效率極高,僅使用約5800萬輸出Token,與Gemini 3.1 Pro Preview相當,遠低於Claude Opus 4.6的1.57億和GPT-5.4的1.2億。效率與性能兼顧,是Muse Spark在架構層面的重要突破。

Meta自己也坦承,在“長視野代理系統和編碼工作流”領域仍存在一定差距,這也是未來需要持續補強的方向。

兩種模式:快與深的平衡

Muse Spark上線後,Meta AI應用同步推出兩種工作模式:

  • 即時模式(Instant):針對日常對話和簡單問題,追求快速響應;
  • 沉思模式(Contemplating):面對複雜任務時啟動,可協調多個AI子智能體平行推理,在保持相近延遲的同時大幅提升輸出質量。

這種“多智能體平行”的架構設計頗具新意。以旅行規劃為例,模型可以同時完成行程規劃、目的地對比、活動篩選等多個子任務,最終整合輸出一份完整方案,效率和精度均遠超傳統單鏈式推理。

Muse Spark是一個原生多模態模型,支援文字、圖像等多種輸入形式,具備真正的跨模態理解與互動能力。

在應用場景上,Meta著重佈局了兩個垂直方向:

健康領域:Meta專門與超過1000名醫生合作最佳化訓練資料,使模型在處理醫療建議類問題時具備更高的專業性與安全性。這一舉措訊號明顯——Meta正在將AI定位為“個人健康助手”,而非單純的資訊檢索工具。

視覺STEM(科學、技術、工程、數學):模型在處理視覺化科學與工程問題上表現出色,使用者可以通過拍照或描述來排查家用電器故障、生成互動小遊戲,甚至即時理解技術圖紙。

此外,Muse Spark還可接入使用者在Instagram、Facebook、Threads等平台分享的內容,提供個性化推薦,並在Meta AI眼鏡上實現更強的環境感知能力——這是Meta“具身AI”戰略的重要組成部分。

這或許是Muse Spark發佈中最微妙、也最值得關注的一個訊號。

Meta曾是開源AI生態的旗手,Llama系列開放權重下載,催生了全球數以萬計的開發者應用。然而,Muse Spark首發時選擇了閉源——僅通過meta.ai和Meta AI應用提供,API僅向部分合作夥伴開放私有預覽,普通開發者無法直接呼叫。

祖克柏表示,未來仍計畫發佈“越來越先進的開源模型”,但Muse Spark本身暫不開源。

這一轉變意味著什麼?一種解讀是:Meta已意識到,在前沿模型的軍備競賽中,“開放”固然可以擴大生態,但也意味著提前曝光核心能力、讓競爭對手借鑑領先技術。在真正建立性能優勢之前,Meta選擇先“守住底牌”。另一種解讀則更為商業:Meta需要通過閉源API變現,為每年數百億美元的AI投入找到可持續的商業回報。

兩種邏輯並不矛盾,但都指向同一個方向:Meta正在從理想主義的開源布道者,向務實的AI商業玩家悄然轉型。

“個人超級智能”:祖克柏想要的,遠不止一個聊天機器人

在發佈聲明中,祖克柏將Muse Spark定位為通往“個人超級智能”願景的第一步。這個詞彙的選用絕非隨意——它對應的是Sam Altman口中“AGI”概念的Meta版敘事,暗示Meta的野心在於打造一個真正能夠替代人完成任務的AI代理(Agent),而非只是一個回答問題的聊天工具。

按照這一戰略路線,Meta未來的AI產品將嵌入使用者的全平台數字生活:Instagram的內容推薦、WhatsApp的日程管理、AR眼鏡的即時視覺輔助……Meta擁有全球最龐大的社交使用者基礎,這是OpenAI和Anthropic無法複製的獨特資產。

當然,這也伴隨著隱私風險。目前,使用Muse Spark需要通過Facebook或Instagram帳號登錄,Meta的慣常做法是利用公開使用者資料進行模型訓練。隨著AI深度融合個人社交資料,使用者隱私邊界如何界定,將是監管機構和公眾長期關注的議題。

Muse Spark的意義,不僅僅在於一個模型的性能數字。

它更深層的含義是:Meta終於重新站上了前沿AI的牌桌。在過去一年裡,OpenAI憑藉GPT-5系列、Anthropic憑藉Claude 4系列、Google憑藉Gemini 3系列,分別鞏固了各自的行業地位。而Meta一直以一個“追趕者”的姿態出現,甚至一度被調侃為“AI時代的局外人”。

Muse Spark改變了這一敘事。52分的綜合評分,視覺理解全球第二,Token效率業界領先——這些數字證明,經過9個月的徹底重建,Meta已經具備了與頂尖AI公司正面交鋒的技術實力。

更重要的是,Meta有其獨有的護城河:35.8億日活使用者、跨平台的社交資料網路、AR眼鏡等硬體生態,以及在消費級AI產品上的多年沉澱。一旦模型能力與平台生態真正融合,Meta在AI應用層的爆發力,可能遠超今天市場的預期。

這場AI翻身仗,才剛剛開始。 (鈦媒體)