Llama 4兆巨獸延期，80%核心元老集體辭職？

2025/05/19

•

2兆Llama 4巨獸一再推遲，又傳出了80%團隊辭職的驚人消息！目前，發言人已闢謠資訊不精準，Meta或許迎來了至暗時刻。

Llama 4團隊約80%的人集體辭職？

昨天，來自AI明星初創Prime Intellect的機器學習研究員一則驚天爆料，徹底點燃了AI圈。

就連WSJ幾天前的獨家報導，也被人們翻了出來。

文章稱，Meta旗艦AI模型「Behemoth」一再推遲發佈，內部對公司數十億美元AI戰略的質疑達到頂峰。

而且，文中還給出了更多人員流失的細節：

Llama 1初始團隊中，原來14人中已有11人從Meta離職。

對此，Meta高管Dave Arnold立即闢謠，80%員工逃離的消息不精準。他還特別強調，這些離職的僅是發表Llama 1團隊的人，並非後續的團隊。

與此同時，OpenAI昨日上線了超強編碼智能體Codex。下周，GoogleI/O大會上還將發佈Veo、Flow等一系列爆款。

這場風波，讓行業不禁發出靈魂拷問：Meta在這場AI競賽中，是否已陷入瓶頸？

按照原計畫，Meta會在4月首屆AI開發者大會上，正式上線2兆參數Behemoth。

當時，知情人士表示，由於模型性能未達預期，發佈時間被推遲至6月。

如今，將會延至到今年秋季，甚至更晚。

Llama 4發佈當天，Meta曾首次介紹了這款模型，仍在訓練中。

它是Maverick協同蒸餾的教師模型，使用30T多模態token在32K個GPU上進行預訓練（FP8）。

Behemoth是Meta大模型與OpenAI、Google、Anthropic等抗衡的重要武器。

然而，工程師們在提升其性能方面遇到困難，內部甚至質疑其改進是否足以支撐公開發佈。

甚至，Behemoth的開發困境讓高管們，對Llama 4開發團隊的表現感到失望。

在內部，他們正考慮對AI產品團隊進行重大最佳化調整。

其首款Llama模型，曾由AI研究團隊（FAIR）開發。該團隊以學術研究為主，成員大多是博士。

2023年初，Llama 1及相關論文發佈後，在業界贏得了廣泛的好評。

然而，自那以後，原始論文的14名研究者中有11人已離開公司，新一代Llama模型由另一團隊接手。

今年，Meta還計畫投資高達720億美元，大部分用於AI的研發、基礎設施投入。

然而，上個月，Llama 4模型的上線，卻讓人們大失所望。因其在LMArena上，用了非公開版模型去刷榜，模型排名衝到TOP 3。

一時間，全網質疑Meta造假聲愈演愈烈。最後，LMSYS決定重新評估，結果Llama 4真實排名跌倒了30開外。

在所有對手快速迭代的強壓之下，Meta實屬慌了。

Hyperbolic聯創兼CTO Yuchen Jin稱，自己收到了Meta招募資訊——帶領Llama 5團隊。

另一張來自@kalomaze截圖顯示，Meta發出多個英雄帖，在美國不同地區大量招募軟體工程師。

幾天前，Yuchen Jin用Meta AI測試Llama 4後，體驗感極差。

截圖後讓模型去理解圖片內容，但Meta AI拒絕了回覆。當他去登錄帳號時，也失敗了。

他直言道，「這不僅僅是Llama 4的問題，而是Meta的技術問題」。

當前，其他頂級AI公司同樣在下一代模型的開發中遇到了瓶頸。

先拿OpenAI來說吧，他們原計畫於2024年中發佈GPT-5，至今仍未推出，最新版本僅為GPT-4.5。

不過，在昨天AMA Reddit線上問中，OpenAI副總裁透露，多個產品整合到GPT-5中。而且，據稱，GPT-5將完全基於尚未發佈的模型建構。

另外，Anthropic Claude 3.5 Opus模型自去年宣佈以來，至今未發佈，對外僅表示「即將推出」。

紐約大學資料科學中心助理教授Ravid Shwartz-Ziv指出，「目前，所有實驗室和模型的進步都相當有限」。

這一現象表明，AI模型的未來發展可能比過去慢得多，且成本高昂。

儘管Behemoth的發佈一再推遲，Meta仍有可能選擇提前推出一個功能有限的版本，以緩解外部壓力。 (新智元)