#羅福莉
雷軍挖走前DeepSeek開發人,轟動整個行業
挖人這一塊,雷軍是專業的。“AI天才少女” 羅福莉被雷軍納入麾下,消息一出,沖上熱搜第一。保送北大、研究生期間在頂會ACL狂發8篇論文、從阿里達摩院到DeepSeek-V2核心研發人,集美貌與才華於一身,羅福莉的履歷堪比“開掛”。雷軍對羅福莉也一直難掩青睞,此前傳聞,雷軍曾以千萬年薪“挖人”,外界一片嘩然。如今,一切塵埃落定,羅福莉加入小米AI實驗室大模型團隊,成為小米在AI軍備競賽中擲下的重磅籌碼。前DeepSeek核心開發者羅福莉加入小米,擔任負責人近日,羅福莉在朋友圈發文官宣——正式加入小米,出任MiMo團隊負責人:“智能終將從語言邁向物理世界。我正在Xiaomi MiMo,和一群富有創造力、才華橫溢且真誠熱愛的研究員,致力於建構這樣的未來,全力奔赴我們心目中的AGI。”圖源:微博圖源:微博消息發佈後,迅速沖上微博熱搜第一。圖源:微博Xiaomi MiMo是小米首個推理大模型,於2025年4月30日開源。圖源:百度僅有 7B 的參數規模,在一眾巨無霸模型面前,Xiaomi MiMo可以說毫不起眼。不過,Xiaomi MiMo在數學推理(AIME 24 - 25)和程式碼競賽(LiveCodeBench v5)公開測評集中,爆發出了令人驚訝的能量,不僅成功超越了 OpenAI 的閉源推理模型 o1 - mini,還將阿里參數規模更大的開源推理模型 QwQ - 32B - Preview 也甩在了身後。AI大戰背景下,雷軍也不甘落入下風,對大模型的重視程度可見一斑。早在去年8 月的演講中,雷軍就鄭重宣佈,小米進行科技戰略升級,把 AI 放到了核心位置,還提出 “深耕底層技術、長期持續投入、軟硬深度融合,AI 全面賦能” 的原則。還有消息稱,小米公司正在積極搭建自己的GPU萬卡叢集,以加大對AI大模型的投入力度。小米大模型團隊在成立之初就已擁有6500張GPU資源,而此次搭建GPU萬卡叢集,將進一步提升小米在AI大模型領域的研發實力。知情人士透露,雷軍對於AI硬體的重視程度極高,認為小米必須全力以赴。砸錢這一塊,雷軍更是毫不吝嗇。小米宣佈2025年研發投入將超過300億元,其中四分之一(約75億元)專門用於AI領域。此外,雷軍還公佈了更為長遠的投入計畫:2021-2025年研發投入預計超1000億元,2026-2030年將超過2000億元,主要聚焦於AI、OS、晶片三大底層技術。小米對AI的投入規模,相比一眾網際網路大廠,都是很可觀的。一則震撼業界的消息傳出:小米創始人雷軍以千萬級年薪挖角95後AI天才少女,DeepSeek開源大模型DeepSeek-V2的關鍵開發者之一羅福莉,領導小米AI大模型團隊。不過,當時消息稱,當時羅福莉還在考慮要不要加入小米。目前看來,高調招攬羅福莉,是小米全面佈局AI大模型的重要一步。最後,羅福莉朋友圈官宣短文中“智能終將從語言邁向物理世界”一句話頗有深意。可以看出,和AI賽道其他玩家不同,小米想走一條完全不同的道路,不禁讓人想起小米汽車橫空出世,打得一眾車企措手不及的時刻。那麼,在AI這條路上,雷軍押注的“小米汽車時刻”是否會到來?拭目以待。“小鎮姑娘”到“天才少女”的非典型人生上大學前幾乎沒接觸過電腦,卻最終成為國產大模型DeepSeek-V2的關鍵開發者,羅福莉的“開掛”般的人生,註定充滿閃光燈。出生於四川的95後羅福莉,父親是一名電工,母親是教師。學生時代,羅福莉就讀於當地的“清北班”,並以優異成績考入北京師範大學。羅福莉 圖源:微博進入北師大電腦專業後,羅福莉坦言自己是“電腦領域絕對的‘低起點’者”,甚至在上大學前幾乎沒接觸過電腦。轉機發生在大三,她進入北大語言計算實驗室實習,在3個月內自學Python並投出一篇頂會論文(非一作),之後,羅福莉成功保研進入北京大學計算語言學研究所。在這裡,羅福莉“一戰成名”。2019年,在北大讀碩士的羅福莉創造了令人矚目的學術記錄——她在人工智慧領域頂級國際會議ACL上發表了8篇論文,其中2篇為第一作者。外界的聚光燈紛至沓來,羅福莉被稱作“AI天才少女”。圖源:羅福莉個人公眾號碩士畢業後,羅福莉幾乎拿下了國內各大廠的頂級offer,包括阿里星、騰訊技術大咖、百度AIDU計畫等。她選擇加入阿里巴巴達摩院,這是阿里集團校招最高等級,類似於華為“天才少年”計畫。2022年,羅福莉跳槽至DeepSeek母公司幻方量化,從事深度學習相關策略建模和演算法研究。此後,她又跳槽到DeepSeek,參與了MoE大模型DeepSeek-V2的研發,並成為關鍵開發者之一。今年春節,DeepSeek一炮而紅,開源大模型的風吹入了萬千尋常百姓家,連帶著羅福莉本人的熱度更上一層樓。2月19日,羅福莉在朋友圈發聲:“請網際網路還我一片安安靜靜做事的氛圍吧! 幾年前就說過我並非什麼天才少女,神化一個人的結果就是捧得多高摔得多重!”圖源:微博輿論喧囂下,羅福莉仍想保持對技術的純粹探索。她透露,走紅後曾有各種千奇百怪的機會找上門,“有找我出書的、有找我錄公開課的,甚至有經紀公司找來的”,但她更傾向於專注技術。時間來到10月,網友發現:羅福莉以通訊作者身份出現在小米論文中,推測雙方可能採用“項目制合作”模式。圖源:微博當時不少人猜測,羅福莉或許已經加入小米?答案今日終於揭曉。雷軍曾公開表示,小米在大模型領域的戰略重點是輕量化和本地部署。這一思路與羅福莉在DeepSeek-V2項目中的經驗高度契合,這或許是雷軍看中羅福莉的關鍵原因之一。AI人才大戰,一觸即發雷軍不惜重金挖來羅福莉,是當下AI人才爭奪戰的一個縮影。根據獵聘統計資料,2024年2月至2025年1月,AI技術人才需求同比增長6.53%,人工智慧行業開工首周同比增長18.25%。大廠對AI人才的焦慮,已經呼之慾出。2025年秋招季,各大廠使出渾身解數吸引人才。先是薪酬上。資料顯示,目前人工智慧人才平均最低月薪超過4.7萬元。在今年春招首周,AI工程師以21319元的平均招聘月薪,遙遙領跑了職業薪資榜。更為誇張的是,一些企業甚至為實習生開出了天價日薪,有獵頭爆料,今年字節跳動招的清北演算法博士實習生,日薪竟然有5000元。百度則直接用薪資激勵,IDG部門平均薪資漲幅20%,最高的不僅現金漲50%,股票還能再漲30%。再是崗位釋放上。脈脈統計資料顯示,2025年7月,脈脈上人工智慧新發崗位數量較去年同期增長超10倍,超過1000家AI公司正在爭奪AI人才。字節跳動2026年校招開放超5000個崗位,其中2559個校招崗位中,有1205個直接和AI相關,包括AI智能體應用開發工程師、AI量子化學研究員、電商AI產品經理等新興職位。阿里巴巴AI To C業務開放了數百個招聘崗位,90%集中在AI大模型相關領域。還是那句話,大模型的競爭,最終還是人才的競爭。AI技術迭代速度快得驚人,企業對AI人才的渴望也就達到了空前程度。那麼,擔任小米大模型負責人的羅福莉,將會帶著小米在一種大廠角逐中,殺出怎樣的火花? (網際網路頭條)
小米首個推理大模型開源!雷軍從DeepSeek挖來的天才少女,化名CiCi ?
4月30日上午,小米透過官方公眾號「Xiaomi MiMo」宣佈開源其首個推理大模型Xiaomi MiMo。從模型研發到開源落地,全程未透露任何風聲。更引人注目的是,這次開放原始碼的MiMo-7B模型僅用70億參數規模,便在數學推理和代碼生成兩大核心任務中超越OpenAI閉源模型o1-mini及阿里Qwen的32B參數版本QwQ-32B-Preview。在這次開源事件前,業內曾傳出小米大模型團隊引進關鍵人物的消息。根據多家媒體報導,前DeepSeek核心開發者羅福莉於2024年底加入小米,主導大模型研發。羅福莉碩士畢業於北京大學計算語言學專業,曾在阿里巴巴達摩院任職,因在國際頂會發表8篇論文而走紅。多位小米內部人士向重點君證實,羅福莉確認已經加入小米。 “在雷軍辦公室外看到過她幾次。”這是否為MiMo的誕生埋下伏筆?羅福莉前東家DeepSeek,正是推理模型最極致的玩家。小米官方雖未正面回應,但行業觀察人士普遍認為,頂尖人才的加入加速了小米在推理大模型領域的突破。Xiaomi MiMo大模型的所有技術細節都已經公開,重點君剛讀完技術報告,給大家劃一下重點:一、先說彩蛋。這份技術報告結尾核心貢獻者中未出現羅福莉,唯一有一位單獨用了代稱「CiCi 」。重點君認為,這位「CiCi 」很可能就是羅福莉。畢竟這麼重要的技術報告,除非有特別的原因,否則核心研究人員都願意署真名。(以上推斷僅代表個人觀點,未經小米官方證實)二、論文重點。《MiMo-7B技術報告》提出:1 、MiMo-7B是一款專為複雜推理任務設計的大型語言模型,通過優化預訓練和後續訓練(強化學習)策略,顯著提升小模型(7B參數)在數學、代碼和通用推理任務上的性能,甚至超越部分32B規模的模型。2、核心結論:預訓練階段的高品質推理資料是模型潛力的基礎。RL訓練中需平衡數學與程式碼任務的獎勵機制,避免語言混合問題。輕量級SFT(僅對齊輸出格式)效果有限,需結合深層調整。3.關鍵技術貢獻預訓練優化資料增強:優化資料預處理流程,保留數學公式和程式碼片段;結合高品質自然文字與合成推理資料(如STEM內容產生的分析和解題過程)。三階段資料混合策略:逐步增加數學與程式碼資料的比例(最終佔70%),並擴展上下文長度至32K。多令牌預測(MTP):引入平行預測未來多令牌的機制,提升推理速度(透過推測解碼加速產生)。後續強化學習(RL)優化資料品質:使用13萬可驗證的數學和程式設計問題,透過嚴格過濾保留高難度任務(如測試通過率低於90%的問題)。獎勵機制:提出測試難度驅動的程式碼獎勵,依測試案例的通過率分層分配獎勵,緩解稀疏獎勵問題。動態取樣與重採樣:動態過濾簡單問題,並通過10%機率重採樣穩定訓練。基礎設施:開發Seamless Rollout Engine,整合非同步獎勵計算與連續取樣,訓練速度提升2.29倍,驗證速度提升1.96倍。4.模型架構與訓練細節架構:基於Transformer,整合Grouped-Query Attention、RoPE位置編碼和SwiGLU啟動函數。訓練參數:預訓練25兆標記,分三階段調整學習率與批次大小;RL階段使用GRPO演算法,支援32K長上下文產生。5.實驗結果MiMo-7B-Base (預訓練模型)在BBH(語言推理)得分75.2,顯著優於同類7B模型(如Qwen2.5-7B)。數學推理(AIME 2024)得分32.9,代碼產生(LiveCodeBench v5)得分32.9,均大幅領先同規模模型。MiMo-7B-RL (強化學習調優模型)數學:AIME 2025得分55.4,超越OpenAI o1-mini(50.7)。代碼:LiveCodeBench v6得分49.3,優於QwQ-32B-Preview(39.1)。通用能力:在MMLU-Pro等基準測試中保持競爭力。如果大家感興趣的,可以查看技術報告原文:https://github.com/XiaomiMiMo/MiMo/blob/main/MiMo-7B-Technical-Report.pdf目前MiMo-7B 已開源4個型號至HuggingFace:https://huggingface.co/XiaomiMiMo從模型開源到終端落地,小米正試圖建構「晶片-演算法-裝置」的全端AI生態。 MiMo誕生,正是這場戰役的第一聲號角。最後,為小米和雷總在AI領域的技術進展點贊。永遠相信美好的事情即將發生。 (劃重點KeyPoints)