Google、馬斯克、OpenAI,正在重新洗牌AI格局

Grok 4 在HLE考試中表現接近GPT Deep Research,馬斯克的X.AI第一次在嚴肅榜單上對OpenAI正面交鋒。 Grok 4 也宣佈視覺和程式碼能力將在短期完成升級。這就像一輛新車不僅在速度上追上了特斯拉,還預告馬上搭載全自動駕駛。

Moonshot發佈了 1兆參數的Kimi K2模型。注意,這不是推理參數,而是總參數。換句話說,它在模型架構複雜性上,已經進入第一梯隊。

同時,Google也沒閒著,一口氣連放三個更新:

  • Firebase Studio更新Agent模式,能直接整合MCP、Gemini CLI,開發體驗更像Cursor。
  • 開源GenAI Processors,讓開發者像搭積木一樣建構AI應用。
  • 收購OpenAI目標公司Windsurf失敗,轉而以24億美元挖走核心員工和技術授權。

Perplexity也有大動作,推出AI瀏覽器,要把傳統的網頁變成一個能辦事的AI助理。目標很明確:不是更快看網頁,而是讓你少看網頁。

在辦公室領域,Context推出了AI辦公室套件。不是簡單加個智慧助手,而是Word、Excel、PPT都能基於本機檔案做deep research,也就是說,辦公軟體開始原生具備「查、寫、總結」的能力。

幾個趨勢已經非常明顯:

1.語言模型比拚進入「高考」階段。 Grok 4和GPT Deep Research在同一個考試上PK,標誌著模型評測標準越來越專業化。未來大模型比拚的,不是花俏demo,而是真刀真槍的能力排名。

2、MoE成為參數擴展主流路徑。 Moonshot選擇的是混合專家模型,意味著即便參數上兆,也能控製成本。這是一種“聰明地變大”,而不是單純堆算力。

3.AI能力正深度進入開發和辦公室兩大基礎場景。 開發者得到了更「自動化」的IDE,辦公室人員獲得更「主動型」的檔案助理。 AI不是外掛,而是能力重塑的底座。

最後的風向值得警惕:

巨頭之間的技術和人才爭奪正在白熱化。 OpenAI收購失敗,Google立刻用錢把人和專利挖走。真正的資源,不是算力,也不是資料,而是人才+核心演算法。 (ai自留地)