曾經在AI大模型佈局上相對“佛系”的小米,開始加快步調了。最近,小米砸下了高昂年薪,招攬了一位AI行業大牛加入。
12月20日,據第一財經消息,DeepSeek開源大模型DeepSeek-V2的關鍵開發者羅福莉將加入小米,她或供職於小米AI實驗室,領導小米大模型團隊。
知情人士透露,雷軍對小米在大模型領域發力太晚感到擔憂,於是親自下場挖人,羅福莉的薪酬水平或在千萬元等級。
另據12月26日介面新聞報導,小米正在著手搭建自己的GPU萬卡叢集。而小米大模型團隊在成立時已有6500張GPU資源。
種種跡象表明,未來一年,小米要對大模型大力投入了。
12月初,小紅書博主AI Dance就曾透露,雷軍近期親自交流或面試了多家LLM(大型語言模型)公司的CTO和核心演算法人才。
被雷軍重金招募的羅福莉,在大模型圈內被冠以“95後天才少女”的頭銜。
羅福莉碩士畢業於北京大學計算語言學研究所。2019年,因研二在NLP(自然語言處理)國際頂級會議ACL上發表了8篇論文,其中2篇為第一作者,曾登上知乎熱搜。彼時,常在知乎下場回答問題的羅福莉,也一夜成為“知乎紅人”。
碩士畢業後,羅福莉頂著“ACL8篇論文作者”的光環,加入了阿里達摩院機器智能實驗室。這期間,她主導開發的多語言預訓練模型VECO(同時支援多語言理解和生成的跨語言模型),被納入阿里達摩院深度語言模型體系AliceMind。此外,她還主導了AliceMind的開源工作。
2022年,羅福莉離開阿里達摩院,加入幻方量化(量化避險基金公司)從事深度學習相關策略建模和演算法研究。此後,羅福莉加入DeepSeek,擔任深度學習研究員,並參與了MoE大模型DeepSeek-V2的研發。
羅福莉加入小米,不僅因其過硬的技術實力,她身上“天才AI少女”“95後AI蘿莉”的標籤,也很符合“行銷天團”小米的調性。
今年5月,在DeepSeek-V2模型發佈後,羅福莉在知乎上回答了如何看待該模型的問題。她稱DeepSeek-V2與GPT4的價格相比,是“性價比之王”。這樣“親民”的互動,與小米的風格,可以說頗為契合。
羅福莉將加入小米的消息,印證了小米將在大模型領域加碼的傳聞。
2023年4月,小米在AI實驗室中組建起大模型團隊。AI實驗室主任王斌在同年11月接受媒體採訪時,曾表示小米“不搞AI的軍備競賽”。“內部認為,輕量級模型亦有其存在的市場空間,且在某些特定任務上相比千億大模型亦能具備一定的優勢。”
當時,王斌還透露,“這個團隊的目標還是通用語言大模型,第一步的目標基座模型參數在幾百億,然後會視前期爬坡結果,再決定下一步投入。”
與此相對的,是友商的步步進擊。2023年11月的vivo開發者大會上,vivo發佈了自研十億、百億、千億三個參數量級,由5款語言大模型組成的藍心大模型矩陣。
對於“燒錢”的預訓練大模型,小米相較於其他廠商更顯謹慎。
2023年年度演講中雷軍公開表示:“我們做大模型的思路可能和很多公司不太一樣,我們選擇主力突破的是輕量化和本地部署。”
這也是同步還在造車的小米,要優先保住“現金王”在成本上的考慮。
雲側的大模型在保證巨大算力的前提下,要根據呼叫付費,成本極高。而端側大模型在本地運算,如果將大部分AI推理場景放在端側,能夠大量節約雲端算力開支。
對於一貫注重產品的小米來說,小米使用者在晶片性能、攝影機技術、螢幕顯示等方面有著相對更高的需求。因此,儘管端側大模型在效果上難以媲美雲端,但其在隱私保護、低延遲和成本控制方面的優勢,也能為其產品“性價比”提供保障。
但隨著各家廠商晶片算力的不斷提升,AI Agent與手機硬體的融合已勢不可擋。AI Agent 在人機互動中,能更精準地理解使用者需求,更高效地完成任務。
特別是,隨著國產手機價格邁過4000元大關,有無AI的加持,將成為區別手機高低端的關鍵。IDC預測,2025年中國新一代AI手機市場出貨量將達1.18億台,同比增長59.8%,整體市場佔比達到40.7%。
在這一背景下,小米手機如果不在AI上挖深護城河,其高端化戰略必將面臨巨大挑戰。
據媒體消息,這一次雷軍正是出於小米在大模型領域發力太晚的擔憂,才親自下場招攬人才。看起來,雷軍已經開始開始擔憂,小米對大模型的“激處理程序度”,不及友商的決心堅定。
今年年底,各大手機廠商的旗艦機發佈會上,AI能力的介紹都佔據極大篇幅。vivo不遺餘力地宣傳藍心大模型,榮耀CEO趙明更在發佈會上,讓AI Agent現場點咖啡。
小米在自家手機的AI能力宣傳上,顯得低調了許多。小米15的新品發佈會上,其AI功能更多是常規的AI寫作、AI識音等功能。在講解上,小米也將焦點更多聚集於性能車SU7 Ultra上,對大模型和AI能力的介紹略顯平淡。
這也讓市場產生許多猜測:小米手機的AI能力到底夠不夠硬核?
事實上,小米在AI佈局有天然的場景和必要性。除了手機,小米還是全球最大的IoT裝置製造商,旗下有諸多裝置可以連接“小愛同學”智能體,也可供資訊收集和場景聯動。
此外,小米還有自研系統澎湃OS,未來又面臨著“人車家”全生態佈局。對於小米來說,大模型的難點或不在於認清其必要性,更多在於大模型要如何與小米產品,以及不同體系生態充分融合。
事實上,小米發力AI的時間並不算晚。2023年8月的年度演講中,雷軍表示,小米從2016年7月就開始佈局AI。
2017年,小米正式成立AI實驗室,當時團隊僅有4人,僅用4個月就上線了小米第一代語音識別系統,並公開了在電視語音互動中端到端語音識別的研究成果。彼時,小米將其定義為中文端到端語音識別技術最好的識別率,語音助手“小愛同學”也同步上線。
自此,小米在AI領域的研發投入不斷加大。2019年,小米開放了人工智慧平台,開發者可使用小米的AI技術,開發和發佈應用程式。
2020年,雷軍在小米內部信中宣佈,下一個十年,小米的核心戰略升級為“手機×AIoT”。
此後,小米發佈了自研晶片澎湃C1、成立自動駕駛團隊、小米機器人實驗室,進一步深化在AI領域的佈局。去年8月的年度演講中,雷軍表示,AI相關的團隊已經超過3000人。
未來,隨著羅福莉的進入,小米對AI的佈局力度還會不斷加大。
11月12日,小米大模型團隊發佈公告表示,小米大模型已升級至第二代。大模型在10大能力緯度上表現,相較於上一代平均提升了超過45%,同時豐富了參數矩陣,有從0.3B到30B多個參數規模,分別適配雲邊端各側裝置。
去年年底的“MEET2024智能未來大會”上,AI實驗室大模型團隊負責人欒劍曾表示,小米認為未來的設計中,雲端大模型的結合必不可少。
而從第二代大模型的參數規模上看,30B量級已經能適應雲端場景下的需求,具備相當堅實的zero-shot/上下文學習或一些泛化能力。小米對大模型的適配場景,也可以逐漸不再侷限於端側。
如今,隨著羅福莉加入小米,也無疑將會為小米在大模型能力上,帶來更多可能性。 (投資家)