雷軍砸千萬年薪,挖來95後“天才少女”

曾經在AI大模型佈局上相對“佛系”的小米,開始加快步調了。最近,小米砸下了高昂年薪,招攬了一位AI行業大牛加入。

12月20日,據第一財經消息,DeepSeek開源大模型DeepSeek-V2的關鍵開發者羅福莉將加入小米,她或供職於小米AI實驗室,領導小米大模型團隊。

知情人士透露,雷軍對小米在大模型領域發力太晚感到擔憂,於是親自下場挖人,羅福莉的薪酬水平或在千萬元等級。

另據12月26日介面新聞報導,小米正在著手搭建自己的GPU萬卡叢集。而小米大模型團隊在成立時已有6500張GPU資源。

種種跡象表明,未來一年,小米要對大模型大力投入了。


01 羅福莉何許人也?

12月初,小紅書博主AI Dance就曾透露,雷軍近期親自交流或面試了多家LLM(大型語言模型)公司的CTO和核心演算法人才。

被雷軍重金招募的羅福莉,在大模型圈內被冠以“95後天才少女”的頭銜。

羅福莉碩士畢業於北京大學計算語言學研究所。2019年,因研二在NLP(自然語言處理)國際頂級會議ACL上發表了8篇論文,其中2篇為第一作者,曾登上知乎熱搜。彼時,常在知乎下場回答問題的羅福莉,也一夜成為“知乎紅人”。

碩士畢業後,羅福莉頂著“ACL8篇論文作者”的光環,加入了阿里達摩院機器智能實驗室。這期間,她主導開發的多語言預訓練模型VECO(同時支援多語言理解和生成的跨語言模型),被納入阿里達摩院深度語言模型體系AliceMind。此外,她還主導了AliceMind的開源工作。

2022年,羅福莉離開阿里達摩院,加入幻方量化(量化避險基金公司)從事深度學習相關策略建模和演算法研究。此後,羅福莉加入DeepSeek,擔任深度學習研究員,並參與了MoE大模型DeepSeek-V2的研發。

羅福莉加入小米,不僅因其過硬的技術實力,她身上“天才AI少女”“95後AI蘿莉”的標籤,也很符合“行銷天團”小米的調性。

今年5月,在DeepSeek-V2模型發佈後,羅福莉在知乎上回答了如何看待該模型的問題。她稱DeepSeek-V2與GPT4的價格相比,是“性價比之王”。這樣“親民”的互動,與小米的風格,可以說頗為契合。

羅福莉將加入小米的消息,印證了小米將在大模型領域加碼的傳聞。

2023年4月,小米在AI實驗室中組建起大模型團隊。AI實驗室主任王斌在同年11月接受媒體採訪時,曾表示小米“不搞AI的軍備競賽”。“內部認為,輕量級模型亦有其存在的市場空間,且在某些特定任務上相比千億大模型亦能具備一定的優勢。”

當時,王斌還透露,“這個團隊的目標還是通用語言大模型,第一步的目標基座模型參數在幾百億,然後會視前期爬坡結果,再決定下一步投入。”

與此相對的,是友商的步步進擊。2023年11月的vivo開發者大會上,vivo發佈了自研十億、百億、千億三個參數量級,由5款語言大模型組成的藍心大模型矩陣。

對於“燒錢”的預訓練大模型,小米相較於其他廠商更顯謹慎。

2023年年度演講中雷軍公開表示:“我們做大模型的思路可能和很多公司不太一樣,我們選擇主力突破的是輕量化和本地部署。”

這也是同步還在造車的小米,要優先保住“現金王”在成本上的考慮。

雲側的大模型在保證巨大算力的前提下,要根據呼叫付費,成本極高。而端側大模型在本地運算,如果將大部分AI推理場景放在端側,能夠大量節約雲端算力開支。

對於一貫注重產品的小米來說,小米使用者在晶片性能、攝影機技術、螢幕顯示等方面有著相對更高的需求。因此,儘管端側大模型在效果上難以媲美雲端,但其在隱私保護、低延遲和成本控制方面的優勢,也能為其產品“性價比”提供保障。

但隨著各家廠商晶片算力的不斷提升,AI Agent與手機硬體的融合已勢不可擋。AI Agent 在人機互動中,能更精準地理解使用者需求,更高效地完成任務。

特別是,隨著國產手機價格邁過4000元大關,有無AI的加持,將成為區別手機高低端的關鍵。IDC預測,2025年中國新一代AI手機市場出貨量將達1.18億台,同比增長59.8%,整體市場佔比達到40.7%。

在這一背景下,小米手機如果不在AI上挖深護城河,其高端化戰略必將面臨巨大挑戰。


02 小米大模型為何先發後至?

據媒體消息,這一次雷軍正是出於小米在大模型領域發力太晚的擔憂,才親自下場招攬人才。看起來,雷軍已經開始開始擔憂,小米對大模型的“激處理程序度”,不及友商的決心堅定。

今年年底,各大手機廠商的旗艦機發佈會上,AI能力的介紹都佔據極大篇幅。vivo不遺餘力地宣傳藍心大模型,榮耀CEO趙明更在發佈會上,讓AI Agent現場點咖啡。

小米在自家手機的AI能力宣傳上,顯得低調了許多。小米15的新品發佈會上,其AI功能更多是常規的AI寫作、AI識音等功能。在講解上,小米也將焦點更多聚集於性能車SU7 Ultra上,對大模型和AI能力的介紹略顯平淡。

這也讓市場產生許多猜測:小米手機的AI能力到底夠不夠硬核?

事實上,小米在AI佈局有天然的場景和必要性。除了手機,小米還是全球最大的IoT裝置製造商,旗下有諸多裝置可以連接“小愛同學”智能體,也可供資訊收集和場景聯動。

此外,小米還有自研系統澎湃OS,未來又面臨著“人車家”全生態佈局。對於小米來說,大模型的難點或不在於認清其必要性,更多在於大模型要如何與小米產品,以及不同體系生態充分融合。

事實上,小米發力AI的時間並不算晚。2023年8月的年度演講中,雷軍表示,小米從2016年7月就開始佈局AI。

2017年,小米正式成立AI實驗室,當時團隊僅有4人,僅用4個月就上線了小米第一代語音識別系統,並公開了在電視語音互動中端到端語音識別的研究成果。彼時,小米將其定義為中文端到端語音識別技術最好的識別率,語音助手“小愛同學”也同步上線。

自此,小米在AI領域的研發投入不斷加大。2019年,小米開放了人工智慧平台,開發者可使用小米的AI技術,開發和發佈應用程式。

2020年,雷軍在小米內部信中宣佈,下一個十年,小米的核心戰略升級為“手機×AIoT”。

此後,小米發佈了自研晶片澎湃C1、成立自動駕駛團隊、小米機器人實驗室,進一步深化在AI領域的佈局。去年8月的年度演講中,雷軍表示,AI相關的團隊已經超過3000人。

未來,隨著羅福莉的進入,小米對AI的佈局力度還會不斷加大。

11月12日,小米大模型團隊發佈公告表示,小米大模型已升級至第二代。大模型在10大能力緯度上表現,相較於上一代平均提升了超過45%,同時豐富了參數矩陣,有從0.3B到30B多個參數規模,分別適配雲邊端各側裝置。

去年年底的“MEET2024智能未來大會”上,AI實驗室大模型團隊負責人欒劍曾表示,小米認為未來的設計中,雲端大模型的結合必不可少。

而從第二代大模型的參數規模上看,30B量級已經能適應雲端場景下的需求,具備相當堅實的zero-shot/上下文學習或一些泛化能力。小米對大模型的適配場景,也可以逐漸不再侷限於端側。

如今,隨著羅福莉加入小米,也無疑將會為小米在大模型能力上,帶來更多可能性。 (投資家)