2025 年,小米的 AI 戰略要分三步走

2024 年的最後一天,雷軍很忙。

他不僅出現在小米汽車工廠跨年直播中,為小米的 2024 年作了最終的總結與展望,吸引超 3700 萬人次觀看,還神秘連線嗶哩嗶哩跨年晚會,介紹了自己的 2025 個人願望。

在小米的 2024 年總結中,雷軍用 12 張照片回顧了 2024 年的一些難忘瞬間,包括小米汽車首場發佈會、給小米 su7 車主開車門、小米 15 發佈會等。可以說,手機、汽車、AI 無疑是小米 2024 年最為重要的三個關鍵詞。

雷軍表示,隨著小米汽車業務步入正軌,他開始將注意力轉向 AI 領域,這不僅是個人興趣所在,也是小米生態系統的一次戰略延展。


圖源:網路


AI 已成為眾多企業競相角逐的新高地。作為一家以創新為驅動的科技巨頭,小米在 AI 領域的佈局並非一蹴而就,而是經歷了從萌芽到深耕的漫長歷程。

早在 2016 年,小米便組建了技術團隊,開啟了對 AI 這一前沿領域的探索征程。從最初簡單的語音指令執行,到如今能精準理解使用者複雜意圖、提供個性化服務,AI 助手小愛助手成為小米 AI 技術落地的典型範例,也見證著小米 AI 從無到有再到精的過程。

2024 年,小米 AI 發展又迎來關鍵轉折點,AI 成為貫穿手機、汽車、家居生態的紐帶。從人才投入、模型技術再到產品融合,小米的 AI 三步走戰略還將繼續成為 2025 的主基調。


小米 AI 實力的背後:研發與人才

小米雖然早早就有 AI 相關研究,但真正能夠被稱為小米 AI 大模型起點的還是 2023 年。這一年,小米 AI 實驗室大模型團隊正式組建。

團隊成員來自五湖四海且背景多元,其中既有在 AI 深耕多年的行業專家,也有在機器學習、自然語言處理方向頗有建樹的人才。負責人欒劍曾任職東芝(中國)研究院、微軟(中國)工程院,技術積累深厚。

公開資料顯示,自 2016 年組建 AI 團隊以來,小米經過 7 年 6 次擴展,相關領域人員規模已達 3000 多人,其 AI 技術能力已覆蓋視覺、聲學、語音、NLP、知識圖譜、機器學習、大模型、多模態方向,並逐步接入手機、汽車、AIoT、機器人等業務類股。

2024 年底,又有消息傳出雷軍正以千萬年薪招攬人才,羅福莉就是在這一背景下加入小米並擔任小米 AI 實驗室的大模型團隊負責人的。


圖源:網路


羅福莉本科就讀於北京師範大學電腦專業,大三時進入北大語言計算實驗室實習,選擇 NLP 作為科研方向,之後又保研進入北京大學計算語言學研究所深造。2019 年,羅福莉在人工智慧領域頂級國際會議 ACL 上發表 8 篇論文,其中 2 篇為第一作者,碩士兩年間在國際頂會上發表超過 20 篇論文。

畢業後,羅福莉進入阿里達摩院機器智能實驗室,負責 AliceMind 開放原始碼專案,主導開發了多語言預訓練模型 VECO,該模型在 xtreme 排行榜上曾排名第一。2022 年,羅福莉選擇加入幻方量化從事深度學習相關策略建模和演算法研究,之後又擔任 DeepSeek 深度學習研究員,參與研發 MoE 大模型 DeepSeek-V2。

而在羅福莉之前,小米在今年還對公司 AI 組織架構進行了一輪調整,公司基礎技術平台部成立 AI 平台部,本質上屬於小米技術委員會,由張鐸擔任 AI 平台部負責人,向基礎技術平台部總經理馮宏華匯報。

說到張鐸,這位技術大牛曾在 2016 年-2021 年間任職小米,被雷軍稱作“小米的大神”。


圖源:網路


據悉,張鐸畢業於清華大學電腦科學與技術系,此前在小米任職的 5 年間,曾負責小米開源工作的規劃與推進,參與了小米多個核心項目的開發。期間,張鐸在 2015 年成為 Apache HBase 項目的 Committer,2016 年晉陞為該項目的 PMC 成員,也是國內第一位 HBase 的 PMC 成員,2019 年成為 HBase 項目主席。

2021 年從小米離職後,張鐸選擇加入神策資料,擔任基礎研發部負責人和首席架構師,直到 2024 年 9 月,張鐸在朋友圈發文曬出小米新員工工牌,宣佈回歸小米。

羅福莉、張鐸的加入被外界視作小米全面發力大模型的訊號之一,雷軍一度覺得小米在大模型領域發力太晚。因此,除了人才招募以外,小米為了追趕第一梯隊,近些年在研發投入方面也是下足了血本。

2023 年第一季度,小米研發支出就達到 41 億元,同比增長 17.7%,全年總研發投入超 200 億元;2024 年,小米研發投入再升級,預計達 240 億元。在 2022 - 2026 五年內,小米研發投入總額預計超千億,超 70%流向 AI、OS、晶片領域。


模型突破剛需算力局部,

小米搭建 GPU 萬卡叢集

成立至今,小米 AI 團隊成果頗豐。

2024 年 5 月,小米大語言模型 MiLM 正式通過大模型備案,未來將逐步應用於小米手機等產品中。8 月,小米發佈了大規模預訓練語言模型 MiLM-6B,參數規模達到 64 億。


圖源:小米


在 2024 年 8 月的 C-Eval、CMMLU 大模型評測榜單中,MiLM 模型總榜排名第 10,在同參數等級的模型中排名第 1。在 STEM 全部 20 個科目中,MiLM 模型在物理、化學、生物等多個項目獲得了較高的精準率。

11 月,小米又推出第二代自研大語言模型 MiLM2,在指令跟隨、閒聊、翻譯等關鍵能力上相比首代模型平均提升超過 45%,支援最長 200k 文字窗口。

MiLM2 涵蓋 0.3B 至 30B 多個量級,以適應不同的業務場景和資源需求。其中 0.3B 到 6B 的模型可完成具體、低成本任務;6B 至 13B 的模型支援多工微調;30B 模型專為雲端設計,具備強大的 zero-shot 學習和複雜任務處理能力。

此外在研究領域,2024 年,小米 AI 實驗室大模型團隊有 5 篇論文被 ACL 2024 錄用,2 篇被 EMNLP 2024 錄用。其中 Mobile-Bench 評估基準用於評估 LLM 手機智能體的能力,DetermLR 思維框架可增強 LLM 的邏輯推理能力,ToolPlanner 兩階段強化學習框架,可提升模型的任務完成和指令遵循能力,MobileVLM 則增強了大模型對手機 UI 內和 UI 之間的理解。

雷軍曾對外多次公開表態稱,小米在 AI 領域耕耘多年,面對大模型浪潮,必將全力以赴。而從 AI 大模型研發上看,模型能力都是建立在算力基礎之上的,可以說算力才是 AI 大模型研發的關鍵基石。

從資料上看,AI 大模型動輒數十億、上百億參數,例如 GPT-3,就需要海量訓練資料計算。

這時,單張 GPU 顯然力不從心,叢集平行計算才是大模型訓練的出路。據估算,訓練 GPT-3 最大的 1750 億參數模型大約需要 3.14×10²³ 次浮點運算,若以輝達 A100 GPU 為例,其具有每秒 19.5 兆次(19.5TFlops)的浮點運算能力,在 10 天內完成訓練大約需要 10830 個輝達 A100 GPU。

可見,通過將複雜計算任務拆解,分配到數千張 GPU 同時處理,能大幅縮短訓練周期。以圖像識別模型訓練為例,傳統單卡模型訓練需要數月時間,而這一數字在萬卡叢集加持下,可以直接縮減至幾周甚至幾天完成。

也正因此,頭部的大模型公司基本都在投資基礎算力。

2024 年年中,Meta 透露訓練 Llama 4 模型預計將使用 24 萬塊 GPU,是 Llama 3 所使用 GPU 數量的十倍,並計畫在年底之前部署 35 萬塊輝達 H100 GPU。


圖源:網路


10 月,馬斯克也宣佈 xAI 將建立全球最大的 AI 超算,配備 10 萬張輝達 H100 卡,未來還將擴展至 20 萬張。

視線放到國內,上周,有傳言稱小米正在著手搭建自己的 GPU 萬卡叢集,將對 AI 大模型大力投入,其中有 6500 張 GPU 資源是小米大模型團隊成立之時就已投入使用的。

知情人士稱,該計畫已施行數月之久,雷軍曾表示,“在 AI 硬體這件事情上,最核心的是手機而不是眼鏡,小米在這個領域不 all in 是不可能的。”而這也側面說明,小米的 AI 研發路徑基本還是服務於公司旗下產品的。

再回看雷軍的跨年直播可以發現,AI 在小米的戰略規劃中屬於是手機、汽車等產品的“第二發展曲線”,是下一個賦能小米全生態產品爆發的關鍵。


從手機、汽車再到智能家居,

AI 賦能小米全生態爆發

回顧整個 2024,AI 幾乎是所有手機廠商發力的重點,小米也是如此。對於小米來說,AI 的儼然已經成為貫穿手機、汽車、家居生態的 “智能紐帶”,可以為使用者編織出緊密便捷的連續生活場景。


圖源:小米


在手機生態,小米做到了作業系統和應用功能的兩手抓。小米澎湃 OS 2 發佈時就搭載了前瞻性的端邊雲 AI 子系統,HyperAI 將端雲大模型矩陣、多裝置端側感知、跨端執行能力全面整合,擁有 AI 寫作、AI 識音、AI 字幕、AI 妙畫等功能。

此外,HyperAI 還能將敏感資料在硬體端側進行加密保存,使用者可隨時管理和清空儲存在超級小愛中的記憶資料,借助 AI 技術加強了安全和隱私保護。

在應用層面,小米推出全生態 AI 智能助手超級小愛,利用多模態能力,簡化使用者面對海量裝置時複雜的操作,打通感知 - 理解 - 執行的全鏈路操作,通過大模型的支援進一步最佳化小愛同學的語音識別技術以及智能裝置的互動體驗。

在影像系統中,小米 15 系列手機將 AI 融入互動、影像、性能最佳化各層面。AI 場景智能識別拓展至超 500 種,拍攝城市夜景,AI 精準調優曝光、降噪,暗處細節清晰,霓虹燈光色彩還原逼真。


圖源:小米


在汽車生態,小米將自研底層演算法與大模型融合。如採用變焦 BEV 技術,能根據車輛行駛場景切換識別模式;超解析度佔用網路技術,可提高對障礙物的識別精確度,支援雨雪天氣的智能降噪。

道路大模型方面,小米自研無圖方案道路大模型,可即時生成道路拓撲和高精度地圖,實現路口識別、障礙物自動繞行等功能,其效果媲美高精地圖。端到端的感知決策大模型將感知決策演算法二合一,大模型即時觀察、動態調整,甚至可以將 200cm 的車停進 210cm 車位。

智能座艙體驗方面,HyperMind 成為智能座艙的“大腦”,通過深度學習對使用者操作習慣進行學習,實現 主動智能及跨端智聯。

車載小愛則提供了語音互動功能,在小米 SU7 上市發佈會上,雷軍介紹了小米 SU7 車型搭載的 “全新小愛大模型”。車載小愛支援連續對話,單次喚醒後可連續發出語音指令控車,無需反覆喚醒,同時還具備協同喚醒功能,在車內時只會喚醒車內的小愛同學,避免與其他裝置產生干擾。

小愛同學還可以覆蓋全部核心控車功能,能語音控制車窗、HUD、後視鏡等,即使在離線或無訊號的地區,小愛同學也能正常使用,通過語音實現對中控屏顯示內容的操控。


圖源:小米


在智能家居生態,小米的 AI 佈局同樣基於小愛同學及多種 AI 演算法。通過對大模型的演算法進行深度定製與最佳化,小愛同學更適應智能家居場景,能更準確地理解使用者意圖,更流暢地進行對話交流。未來,小米在家居、智能電器等多個領域還會不斷拓展,並行布幾款令人期待的智能家居新產品。

當然,得益於小米澎湃 OS 自研的跨端互聯框架 Xiaomi HyperConnect,多種小米裝置也能實現跨端協同,人、車、手機、可穿戴裝置、家居都能實現深度互聯和協同,讓使用者在不同裝置上獲得連貫一致的 AI 體驗。

AI 的發展的是如此之快,2023 年才成立的 AI 實驗室大模型團隊,就已經開始在小米全生態鏈產生影響。回顧小米 AI 的發展歷程,從 2016 年團隊初建,到 2024 年的 “人車家全生態” 出現,越來越多超乎想像的智能場景開始走進千家萬戶。

在跨年直播中,雷軍提到了自己的三個 2025 年新年願望,一是 2025 年交 30 萬輛車;二是有時間去更多地方看看美景、嘗嘗美食,順便測測汽車;三是明年要好好健身,打算在健身房打卡 100 次。


圖源:網路


這三個願望或許也在一定程度上反映了小米的 AI 願景,在汽車中欣賞詩與遠方時,我們有 AI 助手陪伴在側,在健身房健身時,我們也有手機 AI 和手錶 AI 提醒著鍛鍊注意事項,並監控健康指標。

AI 通過與產品的融合,已經融入生活,我們也期待在 2024 年交出優秀答卷後,小米依舊能在2025年延續之前的人才投入-模型技術-產品融合三步戰略,在 AI 融合的道路上越走越遠,直至讓 AI 完全成為生活的一種必不可少的體驗。 (前方智能)