#雷軍
雷軍:2025,迎接風暴
從上半年小米成績全面開花,到下半年捲入品牌信任危機,雷軍度過了難忘的2025年。即將過去的2025年,小米創始人、董事長兼CEO雷軍的個人形象,經歷了前所未有的解構。曾經,雷軍是中國企業家中的人氣頂流,溫文爾雅的形象深入人心,會玩梗、親民,成為小米品牌最鮮活的名片。但當形象光環撞上商業事件,雷軍在一些人眼中也變為“行銷高手”。今年是雷軍創辦小米的15周年,也是小米造車的第4年,小米汽車的輿論困境與一年前的高光盛況形成鮮明的反差。對於雷軍而言,這是成績與挑戰並存的一年。一方面,小米的營收和利潤連續三個季度大增,技術和產品進展迅猛。在晶片領域,小米發佈了自主研發設計的3nm旗艦SoC晶片玄戒O1,成為中國大陸首家發佈 3nm製程旗艦晶片的公司之一。在汽車領域,小米SU7系列成為近一年20萬元以上最暢銷的轎車。小米YU7在今年6月發佈後,也創造了3分鐘大定超過20萬輛,18個小時內鎖單24萬台的驚人成績。攝影:佘貴森另一方面,雷軍和小米的品牌形象因多起意外事件而頻頻受到挑戰。安徽銅陵、成都兩起SU7車主的意外事故,引發大眾對小米汽車安全性的質疑。小米SU7 Ultra的挖孔版前艙蓋的設計,也觸發了對小米行銷真實性的信任危機。此後更有真假難辨的“水軍”在各個平台上,密集攻擊小米。在2025年年度演講結束後,雷軍向《中國企業家》等媒體表示:“小米汽車發佈之後,肯定是被黑得最慘的品牌之一。”在雷軍心目中,小米通過造車和自研SoC晶片,轉型為橫跨手機、汽車、家電三大領域的硬核科技公司,本該面貌煥然一新,令外界刮目相看。但現實狀況,顯然超出雷軍預期。當雷軍帶著數千萬的流量,迅速在汽車行業打開局面,成為車圈頂流時;高強度的曝光也讓小米汽車快速告別了“新手保護期”——雷軍必須親自迎接風暴。01 成績與挑戰面對詆毀與質疑,雷軍罕見地怒了。11月16日,他在微博接連發問:“我在談產品定義時說,‘一輛車,好看是第一位的’,這和‘安全是基礎、安全是前提’矛盾嗎?還是在這次採訪,我談設計時候說輪轂最難設計,這有啥問題?”這樣的情緒和心境,只是雷軍在2025年的一個縮影。2025年5月,雷軍在一次內部演講中稱:“我們受到了狂風暴雨般的質疑、批評和指責,我和同事們一樣,一下子都蒙了。”汽車業務無疑是雷軍最關鍵的一役。小米汽車業務的進展速度,也確實令行業驚嘆。11月20日,小米第50萬輛汽車下線。從第1台到50萬台,小米僅僅用了1年零7個多月的時間,創造了國內新能源汽車行業最快的紀錄。小米汽車的盈利速度同樣迅猛。2025年第三季度,小米汽車業務交出亮眼成績單:單季度交付10.9萬輛,收入290億元,毛利率達25.5%,並首次實現單季度經營盈利,經營利潤7億元。02 在失敗的路上再出發造車之外,雷軍在2025年的另一件大事就是自研晶片的上市。今年5月,小米推出了玄戒O1晶片,成為中國大陸首家發佈3nm製程旗艦晶片的公司之一,玄戒O1也被搭載到小米15S Pro手機上。對於雷軍而言,這不是一條容易的路,甚至是一條曾經失敗過的路。小米早在2014年就開始晶片研發,歷時3年,投入10億多元,推出過首款手機晶片“澎湃S1”,但第二代晶片產品澎湃S2遲遲沒有發佈。攝影:鄧攀最終,晶片公司被迫進行改組,暫停了SoC大晶片的研發。在8年前失敗的路上再出發,需要勇氣。雷軍深知自研晶片的殘酷性:“像O1這樣規格的旗艦晶片,如果只賣100萬台的話,平均到每台手機的晶片研發成本就超過了1000美元。如果沒有足夠的裝機量,再好的晶片也是賠錢的買賣。”因此,再出發時,雷軍也遭遇過團隊的反對。他向自己和團隊發問:“假如現在放棄,10年後,我們會為公司帳上多出幾百億元而慶幸,還是為小米這家公司永遠失去晶片業務而後悔?”雷軍回憶稱,小米造車和重啟造芯,幾乎是同時做的決策,把前10年攢下的家底全押上了。這樣的戰略投入被他形容為“同時供家裡兩個孩子上大學,造車、晶片,每個都是五六百億元投入的大項目,壓力令人窒息”。最終,雷軍和晶片團隊還是選擇入局自研。在雷軍看來,全球頂尖的科技巨頭,最終幾乎都成了晶片巨頭,“晶片是小米成功的必由之路。”直到現在,他都堅定地認為,這筆投入絕對是值得的。“退一萬步,那怕最後沒有成功,也將為小米培養出一支強大的晶片研發隊伍,徹底改變小米的質地。”03 重塑與前行面對紛繁的輿論,雷軍決定用行動給外界更好的答卷。11月20日,在第50萬輛車下線儀式上,他表示:“行勝於言,以行踐言。”堅持投入技術,是他堅信肯定不會出錯的事。2025年,小米的研發投入預計超過320億元,未來5年預計投入2000億元。創業15年,雷軍正率領小米從網際網路公司轉向智能製造的新戰場,轉型成一個硬核的科技公司。在他看來,“硬核的科技公司跟網際網路公司不一樣。網際網路是機會驅動的,科技公司是使命驅動的。”2025年10月,小米在武漢的智能家電工廠正式投產。這是小米繼智慧型手機工廠和汽車工廠之後,建設的第三座大型智能製造基地,也是其“人車家全生態”戰略中,大家電類股最關鍵的一次落子。雷軍創辦小米的初心,就是用網際網路技術和方法做製造。在2025年9月的年度演講中,雷軍曾表示:“過去5年,無論對小米還是對我個人,都是一場徹底的蛻變。我們用5年腳踏實地的努力,重塑了小米的骨骼和靈魂。”面對風暴,雷軍和小米只能繼續前行。“從迷茫到蛻變,有時隔著萬水千山,有時只隔了一層窗戶紙。只要持續努力、不斷成長,每個人、每個團隊,都有機會‘逆天改命’。”雷軍在今年的年度演講中說道——如今這句話,也在說給他自己。 (中國企業家雜誌)
這位95後,一年5輪融資,被雷軍追著投資
2025年,中國具身機器人賽道風起雲湧。從今年年初,宇樹科技的機器人登上春晚,正式拉開了中國具身智慧型手機器人元年的大幕;到今年年底,整個具身智慧型手機器人行業百花其放,湧現出大量的明星企業,智元、眾擎、小鵬、優必選……顯然,具身智慧型手機器人賽道正在成為未來最具想像力的賽道。根據摩根士丹利全球具身AI團隊在最新發佈的《機器人年鑑》中預測,基準情形下,全球機器人硬體銷售額將從2025年的約1000億美元激增至2030年的5000億美元,2040年達到9兆美元,並在2050年攀升至25兆美元。這一預測僅涵蓋硬體銷售,若加上軟體服務、維護及供應鏈相關收入,市場規模可能成倍增長。而今天,我們要分享的也正是一位當下機器人賽道炙手可熱的創業明星——首形科技的創始人胡宇航。大多數人可能都沒太聽說過這個名字,但是下面視訊中的這個機器人,大家應該或多或少在短影片平台上刷到過。視訊中的機器人正是由胡宇航和首形科技研發而成,可以說,在具身機器人微表情領域,胡宇航和他創立的首形科技正在成為行業最受關注的標的之一。從2019年成為哥倫比亞大學的研究生,正式進入到機器人領域的研究,到2024年創立首形科技,2025年博士畢業,胡宇航用了短短6年時間。而憑藉著首形科技,胡宇航也正在具身智慧型手機器人行業上演一段精彩的創業故事,僅僅用一年多時間就斬獲5輪融資,受到螞蟻集團、雷軍創立的順為資本、招商局創投等基金的追捧,某種程度上來說,胡宇航的創業征程才剛剛開始。一、哥大博士,幹出一家機器人微表情公司1997年,胡宇航出生於福建泉州,2015年考上廈門大學嘉庚學院的機電工程學院。和大多數上大學的人不同,在大學期間展現了高度的規劃性和自律性,這兩種品質也讓其成為了學校的風雲人物:連續八個學期專業排名第一,並成功考取全國CAD技能等級考試二級證書;除了學業是一個典型的學霸,其在科技競賽領域也屢獲殊榮,拿下包括國家級獎項6次、省級獎項5次和校級獎項3次,同時還成功申請到多項個人專利;此外,胡宇航還展露了創業的潛質,在大學期間他還參加了各類創業比賽,帶領團隊多次斬獲金獎。事實上,在胡宇航最初的預設中,其將會在大學畢業後成為一個創業者。但隨著對當時國內創業形勢的深入瞭解,以及在自己創業實踐的過程中,胡宇航意識到,自己接觸的平台比較小,只有擁有核心技術和人才,才能建立足夠高的技術壁壘,最終才有創業成功的機會。也因此,在大學期間其確立了到美國TOP30的大學留學目標。為此,胡宇航硬生生將過去一直存在的英語短板給生啃了下來,他考了9次托福,4戰GRE(美國研究生入學考試),在備考後期,胡宇航曾自我調侃,已經“學到入魔”:“對任何娛樂都不感興趣。騎車不走路是為了在路上少花一些時間;走路不騎車是因為走路時可以拿起手機刷單詞。”除了英語是出國留學的一個最大障礙石,胡宇航還需要去瞭解意向學校的課程、實驗室、教授研究方向等,針對這些書寫自己的申請文書。為了備考成功,胡宇航甚至放棄了自己當時的創業項目,也放棄了諸多比賽。“很多人不理解,我為什麼要放棄自己所擅長的,選擇和自己最弱的英語死磕到底。但我清楚地知道,既然選擇了就要堅持下去。”也正是這份堅持和死磕,胡宇航最終成功拿下了哥大和加州大學聖地亞哥分校的研究生錄取通知書,最終,胡宇航選擇了哥倫比亞大學。首形科技創始人 胡宇航2019年下半年,胡宇航正式踏上了前往哥大的留學之路,也就在這裡,胡宇航與機器人正式結緣。也就在2019年、2020年前後,人工智慧研究開始突飛猛進,自然語言處理(NLP)和電腦視覺(CV)技術都得到了明顯的發展。“未來AI能更深層次地理解人類語言背後的含義,並結合多模態技術,如語音、圖像、視訊等資訊,全面感知和分析人類的情緒。”胡宇航曾說道。這其中,人類的大多數感官都集中在頭部,人臉作為情緒和表達的聚焦點,是人與人之間最直接的連接方式。在胡宇航看來,人類最偉大的能力並非冰冷的邏輯計算,而是豐富細膩的情感。一個有自然表情,能理解、傳遞情感的面孔,將賦予機器人“表達”這些人類體驗的能力,讓它真正融入我們的世界。也因此,胡宇航踏上了研究人臉機器人的道路,從研究生到哥大博士生,基本每一天,胡宇航的大部分時間都在實驗室和機器人待在一起。而在求學期間,熬夜、失眠、焦慮是常態,他開始大量掉髮甚至還起了蕁麻疹。於是,為了緩解壓力,他開始拍起了短影片,搞起了“抽象”。2022年9月,胡宇航在抖音發佈了第一個留學日記的視訊,在一開始拍抖音時,他並沒有打算做科技博主,而是選擇了成為一個“美食博主”。當時大多數關注他的粉絲,更多也是把他看作一個“抽象帥哥”,作為“電子陪讀”,跟他一起“雲讀博”。直到他發視訊宣佈先後拿下《科學—機器人學》《自然—機器智能》《NPJ—機器人學》等頂刊論文,粉絲們這才發現他是一位隱藏的科技大佬。2024年6月,胡宇航重啟了自己的創業之路,創立了首形科技,英文名是AheadForm,既像征著機器人的頭部,也彰顯他勇往直前的態度。二、翻越“恐怖谷”時間來到2025年5月,當時,胡宇航發佈了一段機器人“甦醒”的視訊。視訊中,一個皮膚白皙細膩的“女孩”睜開眼睛,打量周圍的世界,胡宇航打了個響指,指了指鏡頭,“女孩”好奇地抬眸,眼波流轉,神情困惑,彷彿真的有了生命。影片播放量很快突破百萬,引爆網路。有人直接問能不能眾籌,讓自己能夠成為原始股東;也有人讚嘆其打造了機器人界的“繆斯”,通過高度模擬的面部和靈動表情在一定程度上打破了“恐怖谷效應”,營造出了無限接近真人的外觀和互動效果,而這也正是視訊爆火的原因。客觀上講,由於擬人捏臉技術仍在早期階段,不少人會因為“恐怖谷效應”而對仿生機器人敬而遠之。什麼是恐怖谷效應?其由日本機器人專家森政弘提出,當機器人的外掛和動作接近人類,但仍有微小差異如僵硬的表情、不自然的瞳孔時,人類會產生強烈的不適感,也只有相似度超過某個臨界點時,恐懼感才會下降。“恐怖谷效應”說明圖這種現象可以用一個曲線圖來表示:橫軸是物體的類人化程度,縱軸是人類對該物體的親近感。當類人化程度接近100%時,親近感會再次上升,但在接近的過程中,會形成一個明顯的“谷底”,這就是“恐怖谷”。早在2016年,國外的漢森機器人就推出仿生人形機器人索菲亞,她的擬人性不僅來自以假亂真的橡膠皮膚與超62種微表情,更源於一套精密協同的“感知—認知—表達”閉環系統。通過臉部辨識與眼神互動,讓每一次對話都自然流暢。但也正是這種過於逼真卻又非人的特質,觸發了人們心底的“恐怖谷效應”。而在“恐怖谷效應”的背後,更核心的問題是技術上的不成熟。“如果我們有更好的技術和工程體系,就有可能解決恐怖谷效應。”在胡宇航看來,很少有人會害怕蠟像、雕塑、手辦,因為已經足夠逼真,“只要將機器人原本僵硬的動作變得絲滑、協調,就能大大減少人心中的恐懼”。要解決這個問題,首先也是最關鍵的一點就是演算法。在傳統機器人領域中,關於仿生非線性的研究幾乎一片空白,無論是機械臂,還是四足機器人,動作大多依靠程序的指令,像個“提線娃娃”,呆板僵硬。因此,要想動作流暢,機器人需要學會做表情。但光憑網際網路資料的訓練,機器人並不知道做出的表情是否自然。為此,胡宇航和首形科技,自研了情緒基座模型,通過融合語言、表情、語音、語境等多模態資訊,使機器人能夠理解和表達情緒。這不僅為當前的對話大模型提供了情感延伸能力,也為未來的具身智能提供了“情緒引擎”。這裡還值得一提的是,關於這個情緒基座模型的誕生,還有一個小插曲,當時苦於資料的不足,胡宇航突發奇想到了機器人可以嘗試對鏡學習。於是,胡宇航把一面鏡子放到人臉機器人的面前。通過眼睛裡的攝影機,機器人能將電機指令和臉部表情相對應,彙總給AI模型,再對照網際網路資料,解讀不同表情的意義,建構起語音、語義、表情間的聯絡,這才有了首形科技情緒基座模型的雛形。其次,演算法解決了,還要解決物理世界的問題。由於人臉是無數微動作的耦合,為了讓人臉機器人更加逼真,必須在柔軟、非線性的矽膠皮膚內塞進更多電機,以實現精準調控,同時不能破壞面部結構。作為一個極其小眾又專業門檻極高的交叉領域,機器人人臉的表情理解和控制涉及了大量醫學、工程知識,要找一個對機器人感興趣的醫學生,或者找一個有醫學背景的工程師,都無比困難。找不到同行者,胡宇航就決定自己獨自前行。沒有參考文獻,沒有工程先例,從演算法、模型的開發,到實物的搭建、調優,全靠他一個人。他經常一個人窩在實驗室,3D列印出零部件,跑程式碼、建模型、搭實物,光是廢棄的“臉皮”就塞滿了一整箱。失敗了幾十次後,他多了兩個“搭子”——“冷酷”和“冷漠”,一個登上了《科學-機器人學》,一個參與了科幻電影Posthuman的拍攝。圖源:U航視訊  “冷酷”與“冷漠”2025年6月,28歲的胡宇航從哥倫比亞大學博士畢業。此時的他,已經兼具多個耀眼的光環:擁有上百萬粉絲的科技博主;手握數篇頂級期刊的哥大博士,以及首形科技的創始人……不僅如此,其創立的首形科技更是在一年多的時間裡面狂攬5輪融資。在9月份的億元級融資引發螞蟻集團、招商局創投、順為資本等的激烈競爭後。12月份,首形科技再獲新一輪融資,由中國網際網路投資基金(中網投)與螞蟻集團聯合領投,其他投資人包括上海未來產業基金、東方富海,老股東招商局創投持續超額追投。圖源:天眼查事實上,當AI 從工具演化為類人智能體,無數人應該都會產生一個好奇,它應當以怎樣的物理形態存在於人類世界?而人形面部的情緒表達,其實承載著具身智能跨出關鍵一步的可能性:它不僅影響“看起來像不像人”,更決定了AI能否在真實世界中建立穩定的互動心智、觸達更高維度的體驗層。圖源:U航視訊  人臉機器人“Emo”某種程度上來說,從眼神到表情,從口型到微動作,這些看似細小的“類人線索”,本質上是未來智能體能否成為可信賴的互動主體的基礎設施。也正如胡宇航在視訊中所期待的:讓人工智慧和機器人不再是冰冷的工具,而是具備身體,自我認知與情感共鳴的新物種。三、具身智能時代,中國創業者們百花齊放“感謝大家的持久陪伴和寶貴建議,和我一起讓機器人擁有表情,理解情緒越來越接近生命體,你們不是看客,而是這個旅途中的同行者。”2025年7月份,站在WAAIC的聚焦燈下,在機器人領域已摸索了5、6年的胡宇航仍保持著激情和謙遜。對於胡宇航來說,在探索人工智慧和機器人的路上,新的征程才剛剛開始。而對於中國具身機器人產業而言,胡宇航與首形科技的崛起,無疑也是中國具身智能時代的一個縮影。它標誌著中國創業者們,正從以往的技術跟隨與應用創新,邁向前沿基礎研究與核心體驗定義的“無人區”。過去很長一段時間,中國科技創業的經典敘事是“Copy to China”,即在成熟的商業模式或技術路徑上,結合本土市場進行快速迭代與規模化應用。然而,在具身智能——這個融合了人工智慧、精密機械、材料科學、認知心理學等多學科的賽道,規則正在被改寫。除了首形科技,中國具身機器人賽道正在呈現出“百花齊放”的繁榮景象:宇樹科技的通用人形機器人以高動態運動控制能力驚豔春晚,智元機器人瞄準工業生產場景推動商業化落地,優必選在大型仿人服務機器人及教育領域持續深耕,小鵬等車企憑藉在智能駕駛中積累的感知與控制能力跨界入局……而在“百花齊放”的背後離不開幾點關鍵因素:1.全產業鏈與極致工程化能力中國擁有全球最完整、響應最快的機器人供應鏈體系。從無框力矩電機、諧波減速器,到各類感測器、結構件,創業者能夠以極低的成本和極快的速度進行原型迭代。2.超大規模市場與豐富的應用場景從工業製造到家庭服務,從醫療康復到教育培訓,中國複雜多元的經濟社會結構,為具身機器人提供了海量的潛在應用場景和試錯空間。這不僅吸引了資本,更讓技術能在真實的反饋閉環中持續進化。3.活躍的資本與投資者的參與正如前文提到的,螞蟻集團、順為資本、招商局創投等兼具財務實力與產業生態資源的“聰明錢”紛紛重倉押注。它們帶來的不僅是資金,更是對技術路線的背書、產業資源的對接以及對長期主義的耐心。這形成了一個“頂尖學術人才+風險投資+產業資本” 的黃金三角,加速了實驗室技術向商業產品的轉化。4.一代“科學家創業者”的集體登場以胡宇航為代表的科技創業者,是新一代中國創新者的縮影。他們通常擁有世界頂級的科研訓練背景,在攻讀學位期間就已觸及領域前沿。這種“研而優則創”的模式,確保了創業公司的技術底蘊和創新銳度。在1994年,張朝陽在他的第一份商業計畫書——“中國線上”的封面上,寫下來兩句英文:“Riding the waves of our times,one is the coming of age of the information superhighway,another is the mergence of China as a global power.(順應我們這個時代最偉大的兩個潮流,一是資訊高速公路時代的到來,另一個是中國作為全球大國的崛起)”那時,張朝陽還不知道自己的創業能做什麼。而當時間來到當下這個節點,三十餘年後的今天,我們發現,以胡宇航、王興興等為代表的中國具身智能創業者們,正在以穩健的步伐書寫一個關於“融合”的嶄新故事。我們也期待著,在百花齊放之後,中國具身智能產業能夠孕育出引領下一個時代的參天大樹。 (筆記俠)
“雷軍的AI秘密武器”羅福莉首秀:詳解小米AGI之路
12月17日,2025小米“人車家全生態合作夥伴大會”舉辦。在這次大會上,小米MiMo團隊負責人羅福莉完成了首秀演講。作為前DeepSeek核心成員,羅福莉自從加入小米,就被視為小米AI研發走向“正規軍化”和“極客化”的里程碑。市場曾期待她能帶來像DeepSeek那樣顛覆性的“小而美”模型,而羅福莉身上AI時代的極客特質,也許能與小米初創時期的極客基因完美相融,產生新的化學反應。羅福莉的首秀略顯緊張,但不負眾望,她帶來了一個高效的模型MiMo-V2-Flash,也拋出了新的AGI夢想。在她看來,現在的模型大多隻是“完美的語言外殼,沒有錨定現實世界的物理模型”;“真正的智能是從互動中活出來的”,通往AGI的必經之路,不是打造一個程序,而是“推演整個世界的運作邏輯,打造一個虛擬宇宙”。這次首秀,羅福莉確實帶來了鮮明的“DeepSeek 基因”,比如MoE架構、MTP技術和對極致效率的追求。此次開放原始碼的MiMo-V2-Flash模型,它具備三個核心特點:高效推理:雖然總參高達309B,但通過MoE架構僅啟動15B,結合被低估的MTP(多令牌預測)技術,生成速度達到150 tokens/秒。這帶來約2.5倍加速,主要為瞭解決車機、助手等端側互動對延遲的敏感。創新的長文字架構:設計上追求“簡單優雅”,採用Hybrid SWA機制,鎖定128 tokens的“神奇窗口”。這不僅支援256K長上下文,固定了KV快取以降低硬體壓力,還在程式碼生成上刷新了SOTA。極高的性價比:落地層面非常務實,後訓練階段採用MOPD技術,用極低的計算量(不到標準流程1/50)復刻教師模型性能,意在降低大規模部署的成本。這場首秀被安排在“人車家全生態”大會上,意義耐人尋味。羅福莉在小米的職責很明確:主導大模型研發,通過高效推理與智能體技術,推動AI從“語言互動”跨越到“物理世界”,賦能全生態。但客觀來看,端側AI智能、賦能全生態的理想還在路上,現在的硬體依然難以支撐這樣一個已經“極致效率”的模型。以當前最高端的旗艦手機為例,端側模型的舒適區依然停留在3B到7B參數之間。MiMo-V2-Flash的15B啟動參數,對移動裝置而言依然是“房間裡的大象”。所謂的“高效推理”,更多是指在雲端資料中心實現了高吞吐量,對於使用者手中的終端,這依然是一個重度依賴網路的“雲端模型”。雖然有驚喜,但是此次小米並沒有打破端側AI的算力天花板,對於期待“AI手機”變革的使用者而言,還需要繼續等待。但今天的羅福莉,確實在給小米,講了一個可圍繞“人車家生態的”、新的AGI故事。以下為演講實錄(為最佳化閱讀體驗,做了二次編輯、刪減):01 從生物演變看 AI 發展路徑今天我想帶大家換一個視角,從 10 億年生物進化的長河中,重新去審視我們正在經歷的這一場 AI 變革。如果我們回到生命進化的歷程,會發現自然界在建構智能這座金字塔時,遵循著非常嚴密的邏輯:在 6 億年前,生命首先學會了控制身體與環境互動;緊接著進化出了多巴胺系統,通過強化學習進一步提升生存能力;在 2 億年前,哺乳動物的大腦首次具備了在行動前先在大腦裡模擬未來的能力;最終我們發現,人類才登上了智能的塔尖,掌握了語言這一抽象的符號系統。所以我們能看到,生物演化的規律是先具備對物理世界的感知和生存體驗,最後才誕生了語言。但大家都能發現,到現在為止,大模型的發展路徑其實跟生物進化路徑是不同步的,甚至說是一種倒敘,或者說是一種跳躍。生物是先從行動進化到思考,再進化到語言;但是大模型是先學會了語言,再去補齊它的思考能力,最後再去補齊對物理世界的模擬以及具身感知。為什麼大模型智能的產生首先是在語言領域?因為語言不僅僅是一種符號的排列組合,更是人類思維以及對於世界的一種描述。在文字領域的投射,本質上是一種失真壓縮。當大模型通過 Next Token Prediction(下一詞預測)這種範式在海量文字裡進行學習,試圖把 Loss(損失函數)降到最低的時候,我們發現它不僅僅是在擬合一個統計規律,而是在壓縮人類數十億年間關於這個世界的認知同構。這種壓縮的過程,在我們看來就是一種智能。所以,大模型通過語言的爆發,通過 Scaling(擴展)算力和資料,從而理解了人類的思維和對世界的理解。但其實它並不真正像人類一樣具備對整個物理世界的感知。嚴謹來說,它應該是成功地解碼了人類思維在文字空間的一個投影。大家都能看到,這其實是一種自頂向下的捷徑,因為它是在學習一種智能的結果,來倒推智能產生的過程。02 MiMo-V2-Flash 的誕生,解決三大核心問題不管怎麼說,語言包含了人類對世界極致的壓縮,是智慧的結晶,也是高階智能體之間高效協作的工具。因此,小米從語言出發,建構了全新一代面向 Agent(智能體)的基座模型——MiMo-V2-Flash。MiMo-V2-Flash 在研發之初,主要圍繞著三個非常關鍵的問題展開:第一,我們認為當代的智能體必須要有一個高效的溝通語言,即程式碼能力和工具呼叫能力。第二,目前智能體之間的溝通頻寬非常低,如何加速頻寬?這需要一個推理效率極高的模型結構。第三,Scaling 的範式已經逐步從預訓練(Pre-train)轉向後訓練(Post-train),我們如何激發後訓練的潛能?這就需要一個穩定的範式,以便在強化學習(RL)上投入更多的 Compute(算力)。在這三個問題的驅動下,我們看到了 MiMo-V2-Flash 超強的基座潛能。雖然它的總參數在我看來非常小——總參數 309B,啟動參數隻有 15B,我甚至都不願意稱它為“大”模型——但它的程式碼能力和 Agent 能力在世界級公開公正的評估榜單上,已經進入了全球開源模型 Top 1-2 的行列。基本上,大部分評估基準已經超過或者與 DeepSeek-V3、Kimi、Qwen 等模型相當,而這些模型的總參數量通常是 MiMo-V2-Flash 的兩倍到三倍。03 性能與成本的平衡,挑戰推理不可能三角這個圖展示了全球相同水位大模型在價格和速度上的比較:橫軸是推理價格(從大到小),縱軸是推理速度(從小到大)。我們能看到 MiMo 在右上角,代表了低成本、高速度。舉兩個模型進行對比: 比如 DeepSeek-V3.2,MiMo-V2-Flash 比它更便宜一點,但推理速度大概是 V3.2 的三倍左右。再比如 Gemini 2.5 Pro,雖然綜合性能相當,且推理速度差不多,但 Gemini 2.5 Pro 的推理成本比 MiMo-V2-Flash 貴了整整 20 倍。04 架構創新與 MTP 加速那麼我們是怎麼做到這一切的呢?核心關鍵在於圍繞“極致推理效率”重新設計模型結構,主要依靠兩個創新。第一個是 Hybrid Attention(混合注意力)結構。我們採用了 Hybrid Sliding Window Attention(混合滑動窗口注意力)和 Full Attention(全域注意力),比例大概是 5:1。為什麼選 Sliding Window Attention?因為它看起來非常簡單,只關注鄰域的 128 個 Token。經過大量實驗驗證,我們發現一些看似複雜的 Linear Attention(線性注意力)結構,在兼顧長短文推理和知識檢索的綜合性能上,其實並不如簡單的 Sliding Window Attention。更重要的是,它的 KV Cache 是固定的,能非常好地適配當代主流的 Infra(基礎設施)推理框架。圖:全域注意力(GA)和滑動窗口注意力(SWA)的1:5混合結構第二個是 挖掘 MTP(Multi-Token Prediction,多令牌預測)的潛力。MTP 一開始被提出是用於做推理加速的,後來 DeepSeek 將其用於提升基座模型能力。我們在訓練時加入了一層 MTP 層以提升基座潛能,並且在微調時加入了更多層的 MTP,用少量算力就提升了 MTP 層的接受率。最終推理時,我們使用了三層 MTP 進行加速平行 Token 驗證。在實際場景中,這種方式能做到 2.2 到 2.6 倍的推理加速。在社區關於三層 MTP 的情況下,我們來看模型輸出吞吐:在單機吞吐能做到 5,000~15,000 Tokens/秒的基礎上,單請求吞吐也能做到 150~155 Tokens/秒。使用 MTP 相比不使用,整體速度提升了 2 到 3 倍。05 訓練範式革新:MOPD 與自進化除了關注預訓練結構的高效性,我們還在思考如何擴展強化學習訓練的 Compute。強化學習訓練通常非常不穩定,因此我們提出了 MOPD(Multi-Teacher On-Policy Distillation,多教師線上策略蒸餾) 範式。它的核心在於 On-Policy,依賴稠密的 Token Level Reward(令牌級獎勵)進行監督學習。通常 Post-train 範式會通過 SFT 和 RL 拿到各領域專家模型。MOPD 則會讓 Student(學生)模型基於自身機率分佈 Roll out(生成)一些序列,然後用專家模型對這些序列進行打分,提供非常稠密的監督訊號。我們發現這種學習效率極高,通過簡短的幾十步就能將各領域專家的能力快速蒸餾到 Student 模型上。此外,我們還有一個意外發現:當 Student 很快超越 Teacher 時,我們正在嘗試將 Teacher 替換成更強的 Student,繼續自我迭代提升,這是一個正在進行中的工作。06 邁向物理世界:從語言模擬到真實互動MiMo-V2 已經初步具備在語言空間模擬世界的能力。比如,我們可以通過 HTML 讓它寫一個作業系統,很多功能都是可實現的;或者寫一個 HTML 模擬太陽系;甚至做一個畫聖誕樹並產生互動的小 Demo。MiMo-V2-Flash 已經在昨天發佈,我們開源了所有模型權重,同步了技術報告細節,並提供了 API 供開發者接入 Web Coding IDE。我們的體驗 Web 也已上線,大家可以掃描試用。雖然現在的大模型能聊天、能寫程式碼,但我相信大家還是不放心把身邊複雜的任務交給它。我認為真正的下一代智能體系統,不應該只是一個語言模擬器,而是需要跟世界共存。下一代智能體必須具備兩個潛能: 第一,從“回答問題”變成“完成任務”。 這不僅需要記憶、推理、規劃能力,更需要一個 Omni(全模態)的感知能力。做一個統一的動態系統非常必要,這是理解世界的基礎。有了這個基礎,模型才能無縫嵌入到像眼鏡這樣的智能終端,融入我們的生活流。第二,建構物理模型。 回到開頭的話題,現有大模型本質上是用算力的“暴力美學”攻克了頂層的語言和第二層的強化學習,但跳過了中間對世界的感知和模擬,以及底層的實體互動。這就是為什麼大模型能做奧數、模仿莎士比亞,卻不懂重力等物理法則,經常產生具身幻覺。因此,AI 進化的下一個起點,一定要有一個可以跟真實環境互動的物理模型。我們要打造的本質上不是一個程序,而是一個具備物理一致性、時空連貫性的虛擬宇宙。這意味著 AI 能力的本質跨越——不僅僅是看懂畫面,而是理解背後的物理規律;不僅僅是處理文字,而是推演世界的運作邏輯。真正的智能絕對不是在文字裡讀出來的,而是在互動裡“活”出來的。 (騰訊科技)
財富Fortune—雷軍罕見出手,小米的轉折點?
今年上半年股價飆漲約一倍但之後自6月高點最大跌逾35%後,小米集團港股大起大落的路徑與其創始人雷軍的「流量光環」從巔峰到低谷的曲線幾乎完美貼合。在市值承受多重壓力的背景下,雷軍於11月24日斥資逾1億港元增持公司股票,小米公司也密集進行回購,單次回購金額最高可達4億港元,這被解讀為向市場傳遞信心的關鍵訊號。圖片來源:視覺中國公開資訊顯示,這是雷軍自小米2018年上市以來首次在二級市場出手。創始人真金白銀的投入是對短期市場情緒最直接的干預,其象徵意義和市場心理安撫作用毋庸置疑。公告隔日(11月25日),小米股價一度漲超5%,重返40港元上方,此後多日公司持續回購,股價在該水平附近波動,近兩日漲幅均為2%左右,回暖勢頭漸顯。然而,審視小米當下的多維現實,這一舉動更像是在複雜戰局中穩固軍心的策略性動作,距離公司經營與發展軌跡的根本性轉折點或許還需要來自公司及其創始人更明確的訊號。顯而易見的是,這種「護盤」操作無法直接解決小米各條業務戰線上面臨的實質性困境。作為小米基石的手機業務,正承受著成本上漲與競爭下探的雙重擠壓,這已直接反映在財報上。 2025年第三季度,小米智慧手機業務營收為460億元,年減3.2%,毛利率也降至11.1%。這背後的壓力,一方面來自於全球儲存晶片價格進入上行周期,直接推高了製造成本;另一方面來自於競爭對手如華為的Mate80系列採取「加量降價」的激進策略,迫使所有參與者應對份額擠壓。儘管摩根士丹利的歷史回顧顯示小米曾成功轉嫁成本壓力,但在當前需求疲軟和強敵環伺的新環境下,高端化受阻與利潤空間受侵已成為嚴峻現實。同時,小米成長迅猛的IoT與生活消費產品業務也非高枕無憂。今年第三季該業務收入276億元,年增5.6%,但智慧大家電收入年減15.7%,小米稱受「國補」退坡和產業競爭加劇影響。實際上,小米在空冰洗市場面臨傳統巨頭的激烈狙擊,空調領域的線上份額之爭已演變成公開的「羅生門」事件。其高速擴張背後可能隱藏的服務體系與品控壓力,更是未來成長的潛在隱憂。而在各業務類股中被寄予厚望的汽車業務,則生動演繹了何為「流量是一把雙刃劍」。在小米汽車推出的初期,在雷軍個人IP與小米擅長的網路行銷下,流量效應創造了SU7系列上市即爆款的奇蹟。到今年11月20日,小米汽車第50萬輛整車在北京亦莊超級工廠正式下線,雷軍當日發文稱:「從第1台到50萬台,我們僅僅用了1年零7個多月的時間。同事們告訴我,這是國內新能源汽車行業最快的紀錄。」但流量帶來的超高關注度,也使得任何產品瑕疵或宣傳爭議都被置於放大鏡下審視。從「馬力解鎖」規則的爭議到各類安全事故的輿情發酵,小米汽車正陷入「過度行銷」反噬產品信任的困境,對銷量的影響也逐漸顯現。值得注意的是,雷軍於12月1日在社群媒體上發佈的小米汽車宣傳圖顯示,「現車選購」現已對全部使用者開放,12月26日24點前鎖單,預計2025年底前可提車。有業內人士指出,這意味著「小米賣不動了,已經有庫存了」。由此,一個比財報資料波動或短期訂單起伏更深層次的困境逐漸浮現:這本質上是一場由創始人親自締造、卻又逐漸失控的「信任危機」。雷軍作為小米最核心的IP,其個人聲譽與公司品牌深度繫結,這本是龐大的資產。然而,在面臨外界對產品、宣傳乃至安全性的關鍵質疑時,一種策略性的“迴避”與“重構敘事”,正在持續消耗這份寶貴的信用。最典型的例證莫過於SU7 Ultra的「挖孔機蓋」糾紛。當使用者對官方宣傳的「空氣動力學風道」提出實際性能質疑並訴諸法律時,小米法務近期在法庭上以「雷軍作為創始人不懂結構設計」為其微博宣傳內容辯護。此舉無疑割裂了雷軍作為首席代言人與產品責任之間的關係,在輿論上被廣泛視為將企業面子凌駕於消費者權益之上。這種割裂的情形,也使得本來是技術爭論層面的問題演變​​為對創始人誠信的拷問。更大的隱患在於,當涉及到智慧電動車最為敏感的安全問題時,這種「迴避」可能帶來更嚴重的後果。在數起引發公眾關注的事故發生後,小米的官方聲明往往迅速聚焦於“車主操作不當”或“資料未顯示車輛異常”,而對車輛本身在極限狀況下的系統響應、安全冗餘設計等更深層次問題缺乏透明、深入的溝通。在這類問題發酵之時,雷軍本人的社交媒體則時常選擇展示新品發佈或工廠探訪等,與公眾的憂慮形成“錯位”,可能反而會加劇公眾的不信任感。這一困境其實也遠超越小米一家公司的範疇。中國新能源汽車產業正處在從「電動化」上半場邁向「智慧化」下半場的驚險一躍,其核心競爭力正在從硬體的堆料,轉向軟體演算法的可靠性、資料使用的倫理以及企業與社會溝通的透明度。而業界的領導者是否能擯棄「流量至上」思維而採用新模式來處理智慧時代的新問題,關乎整個產業的信任基石。雷軍的增持,或許可以暫時穩住小米股價,但恐怕難以穩住那些因質疑得不到直面解答而悄悄流失的信心。毫無疑問,小米不僅需要一次對關鍵質疑的坦誠面對與系統性回應,而且需要完成一次艱難的轉型:從依賴個人流量和性價比的“明星公司”,成長為一家以可靠產品力和紮實服務贏得信任的“偉大公司”。 (財富中文網)
雷軍押注新賽道!
12月1日,挑戰者創投證實,中國高端黃金珠寶品牌“寶蘭”已完成過億元A輪融資,由挑戰者創投領投,開雲集團、順為資本跟投。其中,順為資本由雷軍創立,挑戰者創投的創始合夥人是元氣森林創始人唐彬森,開雲集團則是全球奢侈品巨頭。三者共同加持,顯示出對高端黃金的濃厚興趣。談及資金用途,“寶蘭”方面表示,本輪融資資金將聚焦四大核心戰略方向,分別為品牌價值深耕、全域管道佈局、供應鏈韌性升級和核心人才賦能,這將為企業長期高品質發展築牢根基,並為高端珠寶市場注入全新動能。據公開資料,“寶蘭”品牌創立於1988年,是一家專注於花絲鑲嵌和古法黃金技藝的高端黃金珠寶品牌。天眼查App顯示,“寶蘭”是杭州寶蘭黃金研究所有限公司旗下的珠寶品牌。該公司成立於2021年5月,註冊資本6800萬元人民幣,公司法定代表人徐畢東,其作為受益人持有該公司90%的股份。工商資訊顯示,公司經營範圍包括貨物進出口、珠寶首飾的批發和零售、金銀製品的銷售等。公開資訊顯示,目前“寶蘭”線上下擁有三家門店,首店於2017年在杭州大廈開出,2020年和2025年分別進駐杭州萬象城和深圳萬象城。據“寶蘭”品牌官方介紹,“寶蘭”的“花絲鑲嵌”工藝,曾吸納了多位國家級非物質文化遺產“花絲鑲嵌”技藝的傳承大師及其弟子。在黃金法金工藝中,“花絲鑲嵌”是擁有三千年歷史的宮廷技藝,被譽為“燕京八絕”冠頂明珠。該工藝要求匠人將黃金千錘百煉、抽拔成絲,再以指尖演繹掐、填、攢、焊等數十道細膩工序,使細過毫髮的金線在時光中交織、堆壘、編織成靈動繁複的立體紋樣。在“寶蘭”天貓旗艦店,一隻65克重的古法手工黃金工藝累絲嵌瑪瑙松石手鐲售價125718元;一對30克的古法手工黃金花絲工藝金質累絲宮燈狀耳墜售價為67598元。今年,古法黃金品牌迎來了資本的密集加注。就在11月底,另一家古法黃金品牌琳朝珠寶剛剛官宣了億元級融資,日初資本為獨家投資方。琳朝珠寶是一家號稱打磨過程可能耗時數月甚至長達一年的高端黃金珠寶品牌,據稱日初資本創始人陳峰歷時一年多、十多次到訪才叩開了其大門。前有老鋪黃金的爆火,今有投資機構排隊敲門、密集出手,資本緣何青睞古法黃金?值得注意的是,黃金價格持續走高,整體黃金消費前三季度同比下降近8%,黃金首飾消費同比下滑超32%,在此背景下,以老鋪黃金為代表的高端“古法黃金”反而成為過去兩年最亮眼的細分市場。行業預計,2028年古法黃金珠寶市場規模將達到4214億元。有消費賽道投資人指出,當下珠寶消費的價值追求正朝著多元價值維度躍遷。無論是承載家族情感的傳統傳家寶,還是年輕一代追求的文化表達與個性象徵,珠寶被賦予的意義愈發豐富。“寶蘭此次億元級融資的順利完成,不僅是對品牌價值的認可,更反映出資本市場對以文化賦能、技藝傳承為核心的高端黃金賽道的關注。”艾媒諮詢CEO張毅分析稱,老鋪黃金的市場火爆,成功驗證了高端古法黃金向奢侈品化發展的路徑可行性,為資本長期佈局提供了明確的價值參照與信心支撐。另一位消費VC人士也告訴記者,古法黃金的火爆和文化、情緒還有審美的提升都有關係。不過,和傳統的黃金品牌不同,主打“古法”的高端黃金品牌,其稀缺性是必不可少的,最直觀的表現就是店舖數量少。在近期的一次公開採訪中,琳朝珠寶創始人馬朝賢表示,琳朝珠寶的“花絲全是人工手搓的”,經常要面臨手工模式和規模化的衝突。他坦言,“手工和規模化是永遠沒辦法相容的,就像水和火一樣。如果非要強行相容,那就一定會失了初心,丟了匠心。”這也是在古法黃金品牌接受機構的注資後,業內普遍比較關注的一個問題。據《每日經濟新聞》報導,滬上某VC合夥人向記者坦言,這個問題不太好平衡。“客觀來說,資本的本質是追求規模化增長與投資回報,但古法黃金的核心價值恰恰在於手工技藝的稀缺性與不可複製性。這可能需要雙方後期找到一個比較清晰的邊界,要麼聚焦小眾高端市場做深做精,要麼在非遺技藝的核心環節保留手工屬性,其餘環節通過數位化、標準化提升效率等。” (i財經)