雷軍砸千萬年薪，挖來95後“天才少女”

2024/12/31

•

曾經在AI大模型佈局上相對“佛系”的小米，開始加快步調了。最近，小米砸下了高昂年薪，招攬了一位AI行業大牛加入。

12月20日，據第一財經消息，DeepSeek開源大模型DeepSeek-V2的關鍵開發者羅福莉將加入小米，她或供職於小米AI實驗室，領導小米大模型團隊。

知情人士透露，雷軍對小米在大模型領域發力太晚感到擔憂，於是親自下場挖人，羅福莉的薪酬水平或在千萬元等級。

另據12月26日介面新聞報導，小米正在著手搭建自己的GPU萬卡叢集。而小米大模型團隊在成立時已有6500張GPU資源。

種種跡象表明，未來一年，小米要對大模型大力投入了。

12月初，小紅書博主AI Dance就曾透露，雷軍近期親自交流或面試了多家LLM（大型語言模型）公司的CTO和核心演算法人才。

被雷軍重金招募的羅福莉，在大模型圈內被冠以“95後天才少女”的頭銜。

羅福莉碩士畢業於北京大學計算語言學研究所。2019年，因研二在NLP（自然語言處理）國際頂級會議ACL上發表了8篇論文，其中2篇為第一作者，曾登上知乎熱搜。彼時，常在知乎下場回答問題的羅福莉，也一夜成為“知乎紅人”。

碩士畢業後，羅福莉頂著“ACL8篇論文作者”的光環，加入了阿里達摩院機器智能實驗室。這期間，她主導開發的多語言預訓練模型VECO（同時支援多語言理解和生成的跨語言模型），被納入阿里達摩院深度語言模型體系AliceMind。此外，她還主導了AliceMind的開源工作。

2022年，羅福莉離開阿里達摩院，加入幻方量化（量化避險基金公司）從事深度學習相關策略建模和演算法研究。此後，羅福莉加入DeepSeek，擔任深度學習研究員，並參與了MoE大模型DeepSeek-V2的研發。

羅福莉加入小米，不僅因其過硬的技術實力，她身上“天才AI少女”“95後AI蘿莉”的標籤，也很符合“行銷天團”小米的調性。

今年5月，在DeepSeek-V2模型發佈後，羅福莉在知乎上回答了如何看待該模型的問題。她稱DeepSeek-V2與GPT4的價格相比，是“性價比之王”。這樣“親民”的互動，與小米的風格，可以說頗為契合。

羅福莉將加入小米的消息，印證了小米將在大模型領域加碼的傳聞。

2023年4月，小米在AI實驗室中組建起大模型團隊。AI實驗室主任王斌在同年11月接受媒體採訪時，曾表示小米“不搞AI的軍備競賽”。“內部認為，輕量級模型亦有其存在的市場空間，且在某些特定任務上相比千億大模型亦能具備一定的優勢。”

當時，王斌還透露，“這個團隊的目標還是通用語言大模型，第一步的目標基座模型參數在幾百億，然後會視前期爬坡結果，再決定下一步投入。”

與此相對的，是友商的步步進擊。2023年11月的vivo開發者大會上，vivo發佈了自研十億、百億、千億三個參數量級，由5款語言大模型組成的藍心大模型矩陣。

對於“燒錢”的預訓練大模型，小米相較於其他廠商更顯謹慎。

2023年年度演講中雷軍公開表示：“我們做大模型的思路可能和很多公司不太一樣，我們選擇主力突破的是輕量化和本地部署。”

這也是同步還在造車的小米，要優先保住“現金王”在成本上的考慮。

雲側的大模型在保證巨大算力的前提下，要根據呼叫付費，成本極高。而端側大模型在本地運算，如果將大部分AI推理場景放在端側，能夠大量節約雲端算力開支。

對於一貫注重產品的小米來說，小米使用者在晶片性能、攝影機技術、螢幕顯示等方面有著相對更高的需求。因此，儘管端側大模型在效果上難以媲美雲端，但其在隱私保護、低延遲和成本控制方面的優勢，也能為其產品“性價比”提供保障。

但隨著各家廠商晶片算力的不斷提升，AI Agent與手機硬體的融合已勢不可擋。AI Agent 在人機互動中，能更精準地理解使用者需求，更高效地完成任務。

特別是，隨著國產手機價格邁過4000元大關，有無AI的加持，將成為區別手機高低端的關鍵。IDC預測，2025年中國新一代AI手機市場出貨量將達1.18億台，同比增長59.8%，整體市場佔比達到40.7%。

在這一背景下，小米手機如果不在AI上挖深護城河，其高端化戰略必將面臨巨大挑戰。

據媒體消息，這一次雷軍正是出於小米在大模型領域發力太晚的擔憂，才親自下場招攬人才。看起來，雷軍已經開始開始擔憂，小米對大模型的“激處理程序度”，不及友商的決心堅定。

今年年底，各大手機廠商的旗艦機發佈會上，AI能力的介紹都佔據極大篇幅。vivo不遺餘力地宣傳藍心大模型，榮耀CEO趙明更在發佈會上，讓AI Agent現場點咖啡。

小米在自家手機的AI能力宣傳上，顯得低調了許多。小米15的新品發佈會上，其AI功能更多是常規的AI寫作、AI識音等功能。在講解上，小米也將焦點更多聚集於性能車SU7 Ultra上，對大模型和AI能力的介紹略顯平淡。

這也讓市場產生許多猜測：小米手機的AI能力到底夠不夠硬核？

事實上，小米在AI佈局有天然的場景和必要性。除了手機，小米還是全球最大的IoT裝置製造商，旗下有諸多裝置可以連接“小愛同學”智能體，也可供資訊收集和場景聯動。

此外，小米還有自研系統澎湃OS，未來又面臨著“人車家”全生態佈局。對於小米來說，大模型的難點或不在於認清其必要性，更多在於大模型要如何與小米產品，以及不同體系生態充分融合。

事實上，小米發力AI的時間並不算晚。2023年8月的年度演講中，雷軍表示，小米從2016年7月就開始佈局AI。

2017年，小米正式成立AI實驗室，當時團隊僅有4人，僅用4個月就上線了小米第一代語音識別系統，並公開了在電視語音互動中端到端語音識別的研究成果。彼時，小米將其定義為中文端到端語音識別技術最好的識別率，語音助手“小愛同學”也同步上線。

自此，小米在AI領域的研發投入不斷加大。2019年，小米開放了人工智慧平台，開發者可使用小米的AI技術，開發和發佈應用程式。

2020年，雷軍在小米內部信中宣佈，下一個十年，小米的核心戰略升級為“手機×AIoT”。

此後，小米發佈了自研晶片澎湃C1、成立自動駕駛團隊、小米機器人實驗室，進一步深化在AI領域的佈局。去年8月的年度演講中，雷軍表示，AI相關的團隊已經超過3000人。

未來，隨著羅福莉的進入，小米對AI的佈局力度還會不斷加大。

11月12日，小米大模型團隊發佈公告表示，小米大模型已升級至第二代。大模型在10大能力緯度上表現，相較於上一代平均提升了超過45%，同時豐富了參數矩陣，有從0.3B到30B多個參數規模，分別適配雲邊端各側裝置。

去年年底的“MEET2024智能未來大會”上，AI實驗室大模型團隊負責人欒劍曾表示，小米認為未來的設計中，雲端大模型的結合必不可少。

而從第二代大模型的參數規模上看，30B量級已經能適應雲端場景下的需求，具備相當堅實的zero-shot/上下文學習或一些泛化能力。小米對大模型的適配場景，也可以逐漸不再侷限於端側。

如今，隨著羅福莉加入小米，也無疑將會為小米在大模型能力上，帶來更多可能性。 (投資家)