#C羅
14億身家!在“搞錢”這件事上,他又贏了
又到年末,著名的葡萄牙足球明星C羅(克里斯蒂亞諾·羅納爾多)的名字,突然出現在了國際財經新聞裡。他宣佈,自己最近投資了美國AI搜尋公司Perplexity,成為其股東之一。在社交平台上,C羅寫道:“好奇心是成功的關鍵。每天問一個新問題,你就贏了。”C羅的“贏”是從足球界開始的。他於1997年在里斯本競技俱樂部開啟職業生涯,後轉戰曼聯、皇家馬德里、尤文圖斯等歐洲頂級俱樂部,憑藉精湛球技征服了世界。2025年,他與沙特利雅得勝利隊簽下超4億美元的天價合同,遠超其他運動員。不過,巨額薪資只是他財富版圖的一小部分。C羅在社交媒體上擁有近7億粉絲,這讓他每年的場外代言費就高達數千萬美元。此外,他的個人品牌“CR7”也發展得有聲有色,商品覆蓋了服裝、內衣、香水和主題酒店,涉及衣食住行的各個方面。然而,C羅的野心並未止步於此。近年來,他正逐步向投資人轉型。他不僅是利雅得勝利隊的球員,今年還獲得了俱樂部15%的股權,成為第二大老闆。此外,他投資了西班牙格鬥賽WOW FC,並收購了里斯本的網球中心。C羅在高增長科技賽道也有所佈局。2023年,他給足球遊戲《UFL》投資了4000萬美元。2024年,他與幣安合作推出7款NFT(數字收藏品),上線首週便取得了不錯的成績。外界評價C羅偏好風險投資,特點是“少控股、快周轉”。這種風格與他在球場上的表現如出一轍。今年,他的個人財富達到14億美元,成為足壇史上首位身家超10億美元的富豪。值得一提的是,C羅的未婚妻喬治娜在商業領域也頗有收穫。她在真人秀《我是喬治娜》中被大眾熟知,隨後成為歐萊雅等知名品牌的代言人。2025年,她創立了自己的房地產公司,從事高端房產交易。據估算,她的個人淨資產已達到1000萬美元。C羅曾說過:“我職業生涯中的每一個里程碑都源於同樣的動力:不斷鞭策自己,力求超越昨天的自己,打破自己的紀錄。”看來,在賺錢方面,他同樣勁頭十足,從未有過絲毫懈怠。(圖源:幣安官網、網飛官網、羅納爾多及喬治娜個人社交媒體) (環球人物)
上海米矽:成功流片、全球首款!替代高端!
美商未至、米矽已達!全球首款 4×112G 算力中心模擬CDR電晶片米矽科技首款自研4X112G ASP(CDR)電晶片收髮套片ms89040, ms88040於近日一版流片成功,完成晶片核心功能驗證!米矽科技率先成為全球首家,也是目前唯一一家4*112G CDR做到業界領先指標的模擬公司,美商未至米矽已達!ms89040+ms88040是米矽科技自研全球領先的4*112G CDR+ VCSEL Driver及4*112G CDR+TIA模擬收髮套片。4*112G ASP收髮套片同時還可以替代傳統400G、800G光模組中的oDSP+Driver+TIA晶片, 徹底打破oDSP 100%國外壟斷局面,為高速光模組提供更低時延、更低功耗、更低成本的創新解決方案。該系列ASP已經跟頭部光模組公司合作,共同斬獲了國家科技部重大科研項目。米矽科技創始人羅剛表示 “自2020年成立至今,米矽只做一件事:死磕技術,因為我們相信最大的創新不是追隨,而是開闢全新路徑。”上圖:4×112G 模擬ASP (CDR) 收髮套片技術原理對比:CDR(時鐘資料恢復)通過模擬電路提取時鐘訊號,主要解決抖動問題。核心元件包括鑑相器、鎖相環(PLL)和頻率檢測器,像傳統相機的光學防抖,用物理方式穩定訊號。oDSP(光學數字訊號處理)採用ADC將模擬訊號數位化,通過數學演算法補償光纖損耗、色散和非線性效應 。相當於用Photoshop的AI演算法逐像素修復,能處理PAM4/相干調製等複雜訊號。*資料來源自LightCounting2027 年全球 400G 及以上光模組出貨將超 1 億隻,對應電晶片(含 oDSP、CDR、TIA、Driver)市場規模近 60 億美元,2030 年電晶片市場將突破百億美元。算力中心短距連接米矽科技的4x112G PAM4 CDR核心技術除了400G、800G光模組可替代oDSP方案打破海外壟斷同時成本功耗降50%-70%, 同時也可用於400G、800G AEC方案,在3-7米銅纜傳輸場景替代傳統DSP方案,成本功耗可降低50-70%新的挑戰,新的規劃以前跟隨為主,現在慢慢走到無人區,可參考的地方越來越少了。米矽科技已全面著手研發4*224G ASP(CDR)系列產品,4*448G ASP 系列已在藍圖。一邊定義下一代產品,一邊把技術邊界再往前推,前面沒有參照物,就自己成為坐標。關於米矽科技米矽科技成立於2020年,是一家以研發為主導,集開發、銷售、服務為一體的高科技晶片研發公司。米矽科技團隊是一支成熟海歸高科技人才團隊,源於矽谷,擁有20多年商用、光通訊、時鐘和數模混合積體電路晶片經驗。米矽科技是資料中心光模組的高速電晶片廠家。公司的4*100G TIA(跨阻放大器)和4*100G Driver(雷射器驅動晶片)是資料中心400G、800G光模組的重要晶片。公司的4*112G Retimer晶片(時鐘資料恢復晶片)可用於400G、800G有源銅纜(AEC),用於伺服器機櫃內部的高速互聯。公司的4*112G ASP收髮套片同時還可以替代傳統400G、800G光模組中的oDSP晶片,為這些高速光模組提供更低時延、更低功耗、更低成本的創新解決方案。米矽科技立志於成為高性能光通訊晶片和模擬晶片的世界一流企業,加大研發力量,加速發展腳步,開發出更多擁有自主智慧財產權的晶片,打破國外壟斷,為中國的高端模擬晶片事業作出貢獻。 (芯榜+)
《紐約時報》米特·羅姆尼|向富人徵稅,包括我在內
作者:米特·羅姆尼(Mitt Romney)羅姆尼先生為共和黨人,2019年至2025年擔任美國猶他州聯邦參議員。2012年,一些政治廣告暗示,我提出的某些政策主張一旦落地,就等同於把奶奶推下懸崖。事實上,我的主張恰恰是為了防止這種事發生。而今天,我們所有人,包括我們的奶奶,確實都在朝懸崖走去:如果按預測,社會保障信託基金在2034財年耗盡,福利將被削減約23%。政府需要數兆美元來填補缺口。當放貸者拒絕繼續提供資金,除非能拿到高得多的利率,經濟災難幾乎必然隨之而來。另一種選擇是政府印更多的錢,從而引發惡性通膨,以貶值的方式消化國債,同時也會把你的儲蓄一併稀釋掉。通常,民主黨人堅持提高稅收,共和黨人堅持削減支出。但考慮到國債規模之巨,以及懸崖之近,兩者都不可或缺。政府效率部(DOGE)曾以焦土式方式削減預算,結果慘敗。歐洲則證明,如果稅負高得離譜卻不約束支出,會壓垮經濟活力,從而加速懸崖到來的速度。在削減支出方面,只有對法定福利項目的改革才可能產生實質性影響,因為(Social Security)和醫療保險(Medicare)之類項目佔了政府支出的絕大部分。沒人會認可削減當前或臨近退休人群的福利。但面向未來退休者的社會保障與醫療保險福利,應當實行收入和資產審查,換句話說,按需發放;而領取福利的起始年齡,也應與美國人的預期壽命掛鉤。在稅收方面,是時候讓像我這樣的富人多繳一些稅了。我們目前大約17%的平均關稅稅率,確實能在財政帳上提供一定支撐。把關稅翻倍這在“解放日”之後一度看似可能,但那樣只會進一步加重低收入與中等收入家庭負擔,並對市場造成嚴重後果。我曾長期反對上調聯邦保險繳款法案工資稅在工資收入上的應稅上限,也就是社會保障工資稅的封頂線(今年為176,100美元)。現在我不再反對了;懸崖所帶來的後果,改變了我的看法。新增稅收收入潛力最大的來源,恐怕也正是從公平與社會穩定的角度看最具說服力的一項舉措。有人把這稱作堵住稅法中的漏洞,但“漏洞”這個詞對它們的體量嚴重低估。稱它們為“地窟”或“洞穴”,反倒更貼切。例如,在資產持有人去世這一節點,對巨額資產的資本利得如何處理,本身就是一處典型的“洞穴”。我們以埃隆·馬斯克作一個純假設的代稱來算:假如他當初以10億美元買入特斯拉股票,並一直持有到去世,且屆時這些股票價值達到5000億美元,那麼這4990億美元的增值將永遠不會被徵收約24%的聯邦資本利得稅。為什麼?因為按稅法規定,未實現的資本利得不會在死亡時徵稅。再加上所謂“成本基礎調增”條款,繼承人在取得這些股票時,其成本基礎被視為死亡時的公允市場價值,也就是5000億美元。結果是,這4990億美元的生前累積增值在資本利得稅意義上無人繳稅,永遠如此。當討論的是幫助家庭保住自家的農場時,這項不尋常的規定或許說得通。但它被億萬富翁用來規避資本利得稅。若要增加財政收入,就應當把這處“洞穴”封死,至少對1億美元以上的巨額遺產如此。封堵房地產領域的這些“洞穴”,同樣能帶來更多稅收收入。所謂“1031置換”(1031 exchanges),允許房地產開發商在一棟建築盈利出售時遞延確認資本利得,從而推遲繳納資本利得稅,並且在反覆置換、長期持有等情形下,稅負甚至可能最終落空。對建築購置成本計提折舊扣除,也會把應稅收入壓下去;而在以債務融資購置的結構下,折舊仍可圍繞包含負債在內的成本基礎展開,從而進一步起到“遮蔽”收入的效果。與前一個例子一樣,若某些利潤極其豐厚的房地產資產一直持有到資產持有人去世,那麼其生前累積的增值在資本利得稅意義上也可能不被徵稅。我推測,這些規定最初意在刺激房地產行業;但在今天,它們更像是在為身家數十億美元的人提供稅負上的隔離與庇護。還有更多“漏洞”和“洞穴”值得繼續清點並對超級富豪加以封堵,包括州與地方稅抵扣、附帶權益的稅率安排,以及超大遺產在死亡時的慈善扣除限制等。在這些情形裡,富人並不是在欺騙政府,他們是在按規則行事。但在前方風險如此之大時,我們必須遵循威利·薩頓(Willie Sutton)的規則:錢在那裡,就去那裡。我相信自由企業,也相信所有美國人都應當有機會追求財務成功。但我們已經走到一個節點,無論如何組合解決國家經濟問題的方案,都繞不開一個事實:最富有的美國人必須承擔更多貢獻。當然,如果經濟增長能快得多,我們就能遠離債務懸崖。這句常識長期以來為政客的不作為提供了藉口:減稅承諾帶來的更快增長,永遠都在前方拐角處,然而那個拐角從未到來。是的,稅收會拖慢增長。但我提出的大多數措施,對經濟增長的影響相對有限。如果我的政黨想成為那個為工薪階層與中產階層提供更多機會的政黨,想成為那個試圖恢復人們對資本主義制度信心的政黨,那麼這將是一個起點。這既能幫助我們避開前方的懸崖,也可能在某種程度上平息憤怒。那種憤怒勢必會增長:當失業的大學畢業生看到享受稅收優勢的超級億萬富翁悠然駕駛著300英呎長的遊艇時,他們不會無動於衷。 (一半杯)
“川普推論”將如何落地西半球?
“川普推論”脫胎於202年前的“門羅宣言”、抄襲了100年前的“羅斯福推論”、撤回了10多年前宣告終結門羅主義的“克里講話”,這一看似巧合而又矛盾的多重歷史摺疊,指向美國的全球霸權已開啟總體收縮、局部擴張的長周期。2025年12月2日,白宮於“門羅宣言”發表202周年之際發佈總統公告,正式出台所謂“門羅主義的‘川普推論’”(Trump Corollary,下稱“推論”),拋出“美國人民永遠主宰西半球命運”的全新提法。4日,美國新版《國家安全戰略報告》展開論述推論的目標、政策和手段,誓言恢復美國在西半球的“卓越地位”。6日,美國防長赫格塞思在里根國防論壇演講時進一步闡釋推論的意涵,宣告將以優勢軍力重建在西半球的政治經濟特權。一時間,全球戰略界和政策界的視線聚焦西半球這一長期被忽視的類股。為什麼是西半球?“川普推論”會以何種方式落地?✦ “偷”來的“川普推論”戰略總是能在歷史深處聽到迴響,重視西半球並非川普首創。西半球作為美國全球霸權的起點,一直被美國的政治精英所棧戀。1823年,美國第五任總統門羅發表國情咨文,提出歐洲列強不得殖民、不得干涉美洲、美洲自成一體的三大原則,為門羅主義出籠勾勒雛形。這一宣言在新舊世界之間劃出一條勢力範圍、政治制度和經濟利益的分界線,而獨立不久的美國則要充當新世界的“庇護者”和“代言人”。此後,“門羅宣言”被後來的美國政府不斷解釋推導,逐步衍生出波爾克推論、格蘭特推論、洛奇推論、羅斯福推論、凱南推論等。這一龐大的門羅主義思想譜系,貫穿美國開疆拓境、經濟壟斷、霸權擴張的全過程,被抽象為所謂“半球思維”,即美國要依託南北無強敵、東西臨兩洋的地緣優勢,掌控西半球的資源和通道,提供國土安全的天然屏障和經濟運轉的資源保障。從川普第一個任期開始,共和黨內鼓動其復興和改造門羅主義的聲音不絕於耳。2013年,克里在美洲國家組織發表講話,宣告門羅主義時代終結,激起美國國內右翼民粹勢力的反彈。2024年美國大選前後,MAGA運動的支持者頻頻渲染毒品、移民、安全等風險倒灌美國本土,呼籲川普當選後出台“門羅主義2.0”予以應對。拉馬斯瓦米、德桑蒂斯等共和黨政客及哈爾·布蘭茲等戰略界人士也應聲附和,提出諸如“新門羅主義”“21世紀門羅主義”“升級版門羅主義”乃至“唐羅主義”,相關表述不盡相同,但均指向重視西半球這一共同思想核心。1905年,西奧多•羅斯福以美國對西半球國家有“地區警察權”為由,阻止歐洲列強以武力逼債拉美國家,被稱作“羅斯福推論”。1912年,參議員洛奇利用美國國內對日本企業收購下加利福尼亞州土地的安全顧慮,拓展了門羅主義的適用範圍和對象,從此前的歐洲列強擴大到亞洲國家,從外國政府拓展至外國團體、機構和組織。“川普推論”主張以軍事力量打擊和遏制非法移民、毒品販運、跨境犯罪等戰略威脅,同時強調拒止域外競爭對手,宣示掌控戰略通道、搶佔戰略資源、控制戰略設施、保障產供鏈暢通、拓展盟友網路等目標,實際上是“羅斯福推論”和“洛奇推論”的雜糅,其底層邏輯都是“文明等級論”和“美國優先論”。✦ “川普推論”的前景“川普推論”只是重申了前人鼓吹的所謂“西半球價值”,充其量只是門羅主義的註腳。面對拉美國家的抵制和國內黨爭的掣肘,川普政府“主宰”西半球的野心勢必要落空。從時間看,“川普推論”的日子屈指可數。主要原因有二,一方面是拉美國家的抵制。門羅主義長期被視作美式霸權的遮羞布,遭到西半球國家的一致聲討。近幾屆美國政府都極力與其劃清界限,避免其拉美政策被貼上標籤。從各方反應看,推論的對外擴張傾向、利己利益分配導向以及排他性安全霸權已引發拉美國家的強烈不滿。另一方面是美國國內的黨爭。兩黨對門羅主義存續的立場涇渭分明,矛盾突出。今後,若親手終結門羅主義的民主黨上台,絕不會照搬推論。事實上,即便是共和黨內也不乏反對聲。曾在川普第一任期擔任國務院政策規劃辦公室主任的共和黨人彼得•伯科維茨就曾撰文,駁斥魯比奧將美洲作為外交優先的主張。從空間看,美國可能要戰略收縮至北美一線。儘管推論瞄準西半球,赫格塞思也強調“西半球是美軍的底線”,但現實表明,步入霸權收縮期的美國已然難以完全掌控整個西半球:從區域看,周邊是“重點中的重點”。美國本土接壤和臨近的中美洲、墨西哥和加勒比牽扯毒品販運、無證移民、跨境犯罪等國內治理範疇,不惜要動用軍事手段加以應對,至於南美則暫時鞭長莫及。從議題看,安全是“優先中的優先”。川普政府的主要精力集中在應對非傳統安全威脅,拒止域外國家則退而求其次,且僅能侷限於經濟層面的競爭,主要依靠經濟手段降低西半球國家對外部的依賴。從長遠看,美國戰略收縮的底線主要在北起格陵蘭島、南至加勒比海一線,也即川普所謂的“北美堡壘”。 (中國現代國際關係研究院)
“雷軍的AI秘密武器”羅福莉首秀:詳解小米AGI之路
12月17日,2025小米“人車家全生態合作夥伴大會”舉辦。在這次大會上,小米MiMo團隊負責人羅福莉完成了首秀演講。作為前DeepSeek核心成員,羅福莉自從加入小米,就被視為小米AI研發走向“正規軍化”和“極客化”的里程碑。市場曾期待她能帶來像DeepSeek那樣顛覆性的“小而美”模型,而羅福莉身上AI時代的極客特質,也許能與小米初創時期的極客基因完美相融,產生新的化學反應。羅福莉的首秀略顯緊張,但不負眾望,她帶來了一個高效的模型MiMo-V2-Flash,也拋出了新的AGI夢想。在她看來,現在的模型大多隻是“完美的語言外殼,沒有錨定現實世界的物理模型”;“真正的智能是從互動中活出來的”,通往AGI的必經之路,不是打造一個程序,而是“推演整個世界的運作邏輯,打造一個虛擬宇宙”。這次首秀,羅福莉確實帶來了鮮明的“DeepSeek 基因”,比如MoE架構、MTP技術和對極致效率的追求。此次開放原始碼的MiMo-V2-Flash模型,它具備三個核心特點:高效推理:雖然總參高達309B,但通過MoE架構僅啟動15B,結合被低估的MTP(多令牌預測)技術,生成速度達到150 tokens/秒。這帶來約2.5倍加速,主要為瞭解決車機、助手等端側互動對延遲的敏感。創新的長文字架構:設計上追求“簡單優雅”,採用Hybrid SWA機制,鎖定128 tokens的“神奇窗口”。這不僅支援256K長上下文,固定了KV快取以降低硬體壓力,還在程式碼生成上刷新了SOTA。極高的性價比:落地層面非常務實,後訓練階段採用MOPD技術,用極低的計算量(不到標準流程1/50)復刻教師模型性能,意在降低大規模部署的成本。這場首秀被安排在“人車家全生態”大會上,意義耐人尋味。羅福莉在小米的職責很明確:主導大模型研發,通過高效推理與智能體技術,推動AI從“語言互動”跨越到“物理世界”,賦能全生態。但客觀來看,端側AI智能、賦能全生態的理想還在路上,現在的硬體依然難以支撐這樣一個已經“極致效率”的模型。以當前最高端的旗艦手機為例,端側模型的舒適區依然停留在3B到7B參數之間。MiMo-V2-Flash的15B啟動參數,對移動裝置而言依然是“房間裡的大象”。所謂的“高效推理”,更多是指在雲端資料中心實現了高吞吐量,對於使用者手中的終端,這依然是一個重度依賴網路的“雲端模型”。雖然有驚喜,但是此次小米並沒有打破端側AI的算力天花板,對於期待“AI手機”變革的使用者而言,還需要繼續等待。但今天的羅福莉,確實在給小米,講了一個可圍繞“人車家生態的”、新的AGI故事。以下為演講實錄(為最佳化閱讀體驗,做了二次編輯、刪減):01 從生物演變看 AI 發展路徑今天我想帶大家換一個視角,從 10 億年生物進化的長河中,重新去審視我們正在經歷的這一場 AI 變革。如果我們回到生命進化的歷程,會發現自然界在建構智能這座金字塔時,遵循著非常嚴密的邏輯:在 6 億年前,生命首先學會了控制身體與環境互動;緊接著進化出了多巴胺系統,通過強化學習進一步提升生存能力;在 2 億年前,哺乳動物的大腦首次具備了在行動前先在大腦裡模擬未來的能力;最終我們發現,人類才登上了智能的塔尖,掌握了語言這一抽象的符號系統。所以我們能看到,生物演化的規律是先具備對物理世界的感知和生存體驗,最後才誕生了語言。但大家都能發現,到現在為止,大模型的發展路徑其實跟生物進化路徑是不同步的,甚至說是一種倒敘,或者說是一種跳躍。生物是先從行動進化到思考,再進化到語言;但是大模型是先學會了語言,再去補齊它的思考能力,最後再去補齊對物理世界的模擬以及具身感知。為什麼大模型智能的產生首先是在語言領域?因為語言不僅僅是一種符號的排列組合,更是人類思維以及對於世界的一種描述。在文字領域的投射,本質上是一種失真壓縮。當大模型通過 Next Token Prediction(下一詞預測)這種範式在海量文字裡進行學習,試圖把 Loss(損失函數)降到最低的時候,我們發現它不僅僅是在擬合一個統計規律,而是在壓縮人類數十億年間關於這個世界的認知同構。這種壓縮的過程,在我們看來就是一種智能。所以,大模型通過語言的爆發,通過 Scaling(擴展)算力和資料,從而理解了人類的思維和對世界的理解。但其實它並不真正像人類一樣具備對整個物理世界的感知。嚴謹來說,它應該是成功地解碼了人類思維在文字空間的一個投影。大家都能看到,這其實是一種自頂向下的捷徑,因為它是在學習一種智能的結果,來倒推智能產生的過程。02 MiMo-V2-Flash 的誕生,解決三大核心問題不管怎麼說,語言包含了人類對世界極致的壓縮,是智慧的結晶,也是高階智能體之間高效協作的工具。因此,小米從語言出發,建構了全新一代面向 Agent(智能體)的基座模型——MiMo-V2-Flash。MiMo-V2-Flash 在研發之初,主要圍繞著三個非常關鍵的問題展開:第一,我們認為當代的智能體必須要有一個高效的溝通語言,即程式碼能力和工具呼叫能力。第二,目前智能體之間的溝通頻寬非常低,如何加速頻寬?這需要一個推理效率極高的模型結構。第三,Scaling 的範式已經逐步從預訓練(Pre-train)轉向後訓練(Post-train),我們如何激發後訓練的潛能?這就需要一個穩定的範式,以便在強化學習(RL)上投入更多的 Compute(算力)。在這三個問題的驅動下,我們看到了 MiMo-V2-Flash 超強的基座潛能。雖然它的總參數在我看來非常小——總參數 309B,啟動參數隻有 15B,我甚至都不願意稱它為“大”模型——但它的程式碼能力和 Agent 能力在世界級公開公正的評估榜單上,已經進入了全球開源模型 Top 1-2 的行列。基本上,大部分評估基準已經超過或者與 DeepSeek-V3、Kimi、Qwen 等模型相當,而這些模型的總參數量通常是 MiMo-V2-Flash 的兩倍到三倍。03 性能與成本的平衡,挑戰推理不可能三角這個圖展示了全球相同水位大模型在價格和速度上的比較:橫軸是推理價格(從大到小),縱軸是推理速度(從小到大)。我們能看到 MiMo 在右上角,代表了低成本、高速度。舉兩個模型進行對比: 比如 DeepSeek-V3.2,MiMo-V2-Flash 比它更便宜一點,但推理速度大概是 V3.2 的三倍左右。再比如 Gemini 2.5 Pro,雖然綜合性能相當,且推理速度差不多,但 Gemini 2.5 Pro 的推理成本比 MiMo-V2-Flash 貴了整整 20 倍。04 架構創新與 MTP 加速那麼我們是怎麼做到這一切的呢?核心關鍵在於圍繞“極致推理效率”重新設計模型結構,主要依靠兩個創新。第一個是 Hybrid Attention(混合注意力)結構。我們採用了 Hybrid Sliding Window Attention(混合滑動窗口注意力)和 Full Attention(全域注意力),比例大概是 5:1。為什麼選 Sliding Window Attention?因為它看起來非常簡單,只關注鄰域的 128 個 Token。經過大量實驗驗證,我們發現一些看似複雜的 Linear Attention(線性注意力)結構,在兼顧長短文推理和知識檢索的綜合性能上,其實並不如簡單的 Sliding Window Attention。更重要的是,它的 KV Cache 是固定的,能非常好地適配當代主流的 Infra(基礎設施)推理框架。圖:全域注意力(GA)和滑動窗口注意力(SWA)的1:5混合結構第二個是 挖掘 MTP(Multi-Token Prediction,多令牌預測)的潛力。MTP 一開始被提出是用於做推理加速的,後來 DeepSeek 將其用於提升基座模型能力。我們在訓練時加入了一層 MTP 層以提升基座潛能,並且在微調時加入了更多層的 MTP,用少量算力就提升了 MTP 層的接受率。最終推理時,我們使用了三層 MTP 進行加速平行 Token 驗證。在實際場景中,這種方式能做到 2.2 到 2.6 倍的推理加速。在社區關於三層 MTP 的情況下,我們來看模型輸出吞吐:在單機吞吐能做到 5,000~15,000 Tokens/秒的基礎上,單請求吞吐也能做到 150~155 Tokens/秒。使用 MTP 相比不使用,整體速度提升了 2 到 3 倍。05 訓練範式革新:MOPD 與自進化除了關注預訓練結構的高效性,我們還在思考如何擴展強化學習訓練的 Compute。強化學習訓練通常非常不穩定,因此我們提出了 MOPD(Multi-Teacher On-Policy Distillation,多教師線上策略蒸餾) 範式。它的核心在於 On-Policy,依賴稠密的 Token Level Reward(令牌級獎勵)進行監督學習。通常 Post-train 範式會通過 SFT 和 RL 拿到各領域專家模型。MOPD 則會讓 Student(學生)模型基於自身機率分佈 Roll out(生成)一些序列,然後用專家模型對這些序列進行打分,提供非常稠密的監督訊號。我們發現這種學習效率極高,通過簡短的幾十步就能將各領域專家的能力快速蒸餾到 Student 模型上。此外,我們還有一個意外發現:當 Student 很快超越 Teacher 時,我們正在嘗試將 Teacher 替換成更強的 Student,繼續自我迭代提升,這是一個正在進行中的工作。06 邁向物理世界:從語言模擬到真實互動MiMo-V2 已經初步具備在語言空間模擬世界的能力。比如,我們可以通過 HTML 讓它寫一個作業系統,很多功能都是可實現的;或者寫一個 HTML 模擬太陽系;甚至做一個畫聖誕樹並產生互動的小 Demo。MiMo-V2-Flash 已經在昨天發佈,我們開源了所有模型權重,同步了技術報告細節,並提供了 API 供開發者接入 Web Coding IDE。我們的體驗 Web 也已上線,大家可以掃描試用。雖然現在的大模型能聊天、能寫程式碼,但我相信大家還是不放心把身邊複雜的任務交給它。我認為真正的下一代智能體系統,不應該只是一個語言模擬器,而是需要跟世界共存。下一代智能體必須具備兩個潛能: 第一,從“回答問題”變成“完成任務”。 這不僅需要記憶、推理、規劃能力,更需要一個 Omni(全模態)的感知能力。做一個統一的動態系統非常必要,這是理解世界的基礎。有了這個基礎,模型才能無縫嵌入到像眼鏡這樣的智能終端,融入我們的生活流。第二,建構物理模型。 回到開頭的話題,現有大模型本質上是用算力的“暴力美學”攻克了頂層的語言和第二層的強化學習,但跳過了中間對世界的感知和模擬,以及底層的實體互動。這就是為什麼大模型能做奧數、模仿莎士比亞,卻不懂重力等物理法則,經常產生具身幻覺。因此,AI 進化的下一個起點,一定要有一個可以跟真實環境互動的物理模型。我們要打造的本質上不是一個程序,而是一個具備物理一致性、時空連貫性的虛擬宇宙。這意味著 AI 能力的本質跨越——不僅僅是看懂畫面,而是理解背後的物理規律;不僅僅是處理文字,而是推演世界的運作邏輯。真正的智能絕對不是在文字裡讀出來的,而是在互動裡“活”出來的。 (騰訊科技)
傳奇導演兒子正式被捕!父母心軟將他寵壞,結果一次吵架,他把父母滅門...
昨天,我們剛剛聊到好萊塢傳奇導演羅伯·萊納和妻子米歇爾·辛格被雙雙刺死一事。根據《人物》雜誌的內幕消息,殺死二人的竟然是他們的親兒子,尼克·萊納。今天事情有了新進展,《人物》的小道消息被證實了——洛杉磯警方逮捕了尼克·萊納。(尼克被捕)尼克在事發前住在聖莫妮卡碼頭汽車旅館,距離萊納夫婦被害的豪宅不遠。旅館的工作人員在尼克的房間裡發現了血跡,隨後報警。不久,洛杉磯警方在地鐵站附近逮捕了他。目前他已經被指控謀殺重罪,暫時關押在洛杉磯雙塔懲教所,不得保釋。從警方的態度看,他的殺人嫌疑已經接近100%,基本可以確定就是他幹的。今天各路媒體各顯神通,挖出了不少深層細節。首先是尼克的吸毒史。據知情人士透露,尼克在過去五年一直住在萊納夫婦豪宅的客房中,說白了,就是啃老,他的行為日益變得古怪和可怕。“尼克把那間客房摧毀了不止一次,他成年以來精神狀態就一直這樣,好好壞壞,旋轉門一樣。”“他會吸食冰毒,連續幾天不睡覺,然後突然爆發,砸東西,捶牆……他就像一顆定時炸彈,毒癮越來越嚴重,他父母想讓他離開家。”(尼克·萊納)“他過去常常吹噓自己可以為所欲為,可以從父母那裡拿錢去吸毒、嫖娼。對於摧毀他父母的客房,他一笑置之,對此毫不在意。”“他總是說自己沒碰過海洛因了,說自己能控制住大麻的量,結果他染上了冰毒,持續幾天不吃不喝。他真的控制不住自己,之前他捶牆把自己手捶壞過,還拒絕別人幫助。”“他父母給他下了最後通牒,要麼吃藥戒毒,要麼滾蛋。然後他就和父母吵架。”“讓雙方關係徹底破裂的,是有一次他妹妹羅米·萊納跟他對質,他竟威脅了她,隨後他父母就屢次威脅報警,但最終還是心軟沒報。”(尼克和羅米)這段知情人士的爆料,可信度應該還是有的,因為尼克自己也說過類似的經歷。2018年,尼克本人曾上過一播客節目,主持人問他:“聽說你吸完冰毒,把客房給砸爛了?”尼克回答:“我嗑藥嗑嗨了,我想是可卡因和別的什麼東西。我連續好幾天都沒睡。我開始砸房間裡的各種東西,先是電視,然後是燈,客房裡所有東西都砸了。”主持人又嘗試著問他:“你是否覺得,暴力是你宣洩情緒的方式?”尼克一本正經地否認:“不,你瘋了。毫無邏輯可言。”如今看來,主持人的話一針見血,暴力就是他宣洩情緒的出口,只是他自己沒意識到,或者不願意承認罷了。接著是尼克殺父母的導火索。上周六晚,好萊塢名嘴柯南·奧布萊恩主持了一場聖誕派對,請來很多名流參加,其中就包括萊納夫婦。據《滾石》的說法,萊納夫婦最終還是帶上了尼克,以便“看著他”(Keep an eye on him)。(滾石的報導)在派對上,尼克讓萊納夫婦丟盡臉面,因為他直勾勾地盯著別人看,把別人搞得很不舒服。某內部人士說:“尼克把大家都嚇壞了,他行為很瘋狂,不停問別人是不是明星。”在派對上,尼克和父親發生了非常激烈的爭吵,聲音很大,很多賓客都聽到了。萊納夫婦於是無顏再留在派對上,提前離開了,但目前不清楚尼克有沒有跟他們一起走。這並非尼克第一次在公開場合對父母發脾氣,數月前,尼克就曾幹過類似的事,是在一間餐廳。據餐廳的工作人員說,尼克當時同著其他所有食客的面,對著羅伯大喊大叫。(萊納父子)據TMZ爆料,尼克的母親米歇爾最近幾個月一直在和朋友訴苦,說他們對尼克的精神狀態和藥物濫用束手無策,也不知道該怎麼對待這個兒子。羅伯的一位長期好友也對《紐約郵報》透露:“他們在柯南的假日派對上發生了爭吵,羅伯一直跟別人說,他們很擔心尼克,他的精神狀態正在惡化。”派對後的第二天,也就是周日下午2點,米歇爾的按摩師遵照之前的預約來到萊納家,按了幾次門鈴卻始終沒人開門。按摩師有萊納小女兒羅米的聯絡方式,將情況通知了羅米。下午3點30分左右,羅米趕到父母家查看,卻驚恐地發現了父母的屍體。她大概猜到是尼克干的,對警方表示尼克應該是嫌疑人,他很危險。(萊納夫婦的房子)另外據TMZ爆料,周日凌晨4點,尼克用自己的信用卡入住了那間汽車旅館,且一直沒有退房。目擊者稱,尼克抵達旅館時看起來精神恍惚。第二天,工作人員發現了血跡。所以從種種細節推斷,尼克很可能在周六晚吵架後就殺死了父母。只是周日屍體才被發現。此外在昨天的文章中我們提到,2016年尼克曾寫過一個以他自己“戒毒經歷”為原型的劇本。羅伯為了給這個兒子鋪路,豁出去臉面,親自給他當導演,還動用自己的人脈幫他請演職人員......結果尼克在劇組都不給羅伯面子。當時在片場的特技演員埃裡克·奧德說:“在拍攝期間,兩人在劇組人員面前發生過至少一次激烈的爭吵。你能看出來尼克被寵壞了,而羅伯是真的受夠了他的那些屁事。”“我就想,不管這對不對,這孩子肯定把他爸煩壞了。羅伯做什麼他都覺得不對。尼克就是個‘二代(nepo baby)’,一個徹頭徹尾嬌生慣養的孩子。”萊納夫婦遇害後第二天,一位朋友這樣對媒體說:“這並非他們的兒子第一次有暴力傾向,我知道幾年前,尼克做過另一件事,但我不會透露具體細節,我只是沒想到,事情會發展成這樣......”(萊納夫婦)關於尼克此人,有一位消息人士說得無比精確,他對《紐約郵報》表示:“我認為尼克真的很怨恨他父親——或許也怨恨他自己吧——因為他沒有他父親或爺爺那樣的才華,也沒有作品,還不受人喜歡。”沒有才華,沒有能力,只是一個被寵壞的毒蟲。2015年,尼克和父親曾一起接受《洛杉磯時報》採訪,談及自己因毒癮而流浪的幾年時,尼克表示:“我厭倦了,厭倦了那些狗屁。我來自一個很好的家庭,我不應該流落街頭,住在流浪漢營地,做那些亂七八糟的破事。”(萊納父子)言下之意,流落街頭配不上他,他值得更好的生活。但他值嗎?持續吸毒,4年進18次戒毒所——流落街頭是這個世界對他最恰如其分的懲罰。如果說他值得什麼更好的生活,也全是他父母的功勞。只是他自己認不清這一點罷了。但願法律可以給他應有的懲罰。 (INSIGHT視界)
羅福莉首秀!小米AI野心浮現
在今日舉辦的小米“人車家全生態”合作夥伴大會上,AI能力的全面開放與進化成為核心焦點。在這次會上,小米MiMo大模型負責人羅福莉首次公開亮相。這位被業界稱為“AI天才少女”的95後技術專家曾入職阿里達摩院,後任職幻方量化、DeepSeek並成為DeepSeek-V2關鍵開發者,是小米引入的高端人才中最受關注的一位,市場普遍認為她將扛起小米的AI戰略。今年11月,羅福莉官宣加入小米。12月初,小米集團合夥人、總裁盧偉冰在回應相關問題表示,小米在前幾個季度就已經開始了在 AI 上的壓強式投入,雖然現在還不能透露太多,但是小米在 AI 大模型和應用方面的進展遠超預期。小米認為 AI 與物理世界的深度結合是智能科技的下一站。羅福莉在今日的大會上帶來了小米大模型的具體情況,並分享自己對AI未來的判斷。據她介紹,小米最新MoE大模型MiMo-V2-Flash已經正式開源並上線。她稱,該模型具備超強基座模型潛能,在世界級評估榜單中排到了全球開源模型的TOP2,已初步具備模擬世界的能力。同時,MiMo-V2-Flash實現了低成本、高速度,其成本在低於DeepseekV3.2的情況下,推理速度是其3倍。在會上,羅福莉宣佈MiMo-V2-Flash已全面開源,並提供了API介面,旨在通過開源實現技術的“分佈式加速”,與全球開發者共同推進AGI(通用人工智慧)的普惠化。《科創板日報》記者注意到,在官方微信公眾號“Xiaomi MiMo”上,該模型的開源推文已經獲得2萬+點選量,目前API 限時免費,體驗 Web Demo 已上線。同時,小米也公佈了MiMo-V2-Flash 的 API 定價標準: 輸入 0.7 元 / 百萬 tokens,輸出 2.1 元 / 百萬 tokens。之後,羅福莉進一步分享了小米對AI未來的前瞻判斷。她指出,當前大模型只是一個“完美的語言外殼”,缺乏對物理世界的真實感知,容易產生“具身幻覺”。她認為,AI進化的下一個關鍵,在於建構能與真實環境互動的物理模型。真正的智能體必須從“回答問題”升級到“完成任務”, 具備記憶、推理、自主規劃、決策、執行等能力,並具備統一的多模態感知能力。在這裡,羅福莉提到這種感知能力會為理解物理世界打基礎,從而更好地嵌入眼鏡等智能終端。在今年6月,小米首款AI眼鏡發佈,售價1999元起。當時小米集團創始人、董事長兼CEO雷軍表示,“這是一款戰略級新品,是面向下一代的個人智能裝置,隨身的AI入口。”不過此次大會上,沒有著重介紹AI眼鏡的相關進展,但除了自研大模型,小米還系統性地向開發者開放了其AI能力,如向生態鏈夥伴優先開放了端到端的自動化AI開發部署平台MINT,極大降低了AI應用開發門檻。在會上,小米集團合夥人、總裁盧偉冰再次強調,小米未來五年將在研發上投入2000億元,長期目標是成為全球硬核科技的引領者。具體到今年,預計小米研發投入將達到320-330億元,2026年預計投入約400億。未來,小米將持續投入底層核心技術,持續深耕晶片、OS、AI三大核心技術賽道,與全球開發者共同助力“人車家全生態”全面繁榮。 (科創日報)
金句媲美雷軍!羅福莉首次站台小米演講,揭秘MiMo大模型和背後團隊
羅福莉首次演講有點“小緊張”,但金句很爆。羅福莉加入小米後的首次公開演講,來了!智東西12月17日北京現場報導,剛剛,小米舉辦了年度“人車家全生態”合作夥伴大會,現場人頭攢動座無虛席,展區不少展台都已被圍觀人群擠滿,討論熱度頗高。小米創始人兼CEO雷軍此次並未來到現場,小米集團合夥人、集團總裁盧偉冰率先登台演講,今天第三位演講的是當前備受關注的原DeepSeek核心成員、被業內稱為“天才少女”的羅福莉,她現在的職位是小米MiMo大模型負責人。羅福莉在演講過程中雖然稍顯緊張,但她拋出的海量金句卻句句令人印象深刻:AI正以非線性的方式重演人類大腦6億年的進化史;語言是人類思維和物理世界在符號空間的“投影”;下一代智能體系統不是一個“語言模擬器”,而是一個真正理解我們世界、並與之共存的“智能體”;相比生物演化的穩固根基,AI的發展是“空中樓閣”;AI進化的下個起點,一定是有一個能跟物理世界互動的模型;算力和資料也並非最終的護城河,真正的護城河,是科學的研究文化與方法,是將未知問題結合模型最佳化轉化為可用產品的能力;開放原始碼的價值本質上是一種分佈式的技術加速主義;開源是實現AGI的普惠化,是確保所有人類的智慧共同進化的唯一路徑;在演講中,羅福莉首次明確解讀了小米打造Agent語言基座模型的三個核心方向,解讀了新模型背後的多項關鍵技術突破。對小米如何通向AGI,羅福莉也明確了小米的路徑。除了AI大禮包,今天會上,盧偉冰也分享了小米整體業務的諸多亮點。盧偉冰說,2025年是小米“大發展”的一年,今年前三季度,小米收入同比增長32.5%,超過了3400億元,經調整利潤同比增長73.5%,其中手機銷量中國市場1-10月排名第二。未來五年,小米集團研發投入預計將超過2000億元,2026年預計研發投入在400億左右。小米人車家生態究竟包括什麼?盧偉冰這次給出詳細拆解:產品包括個人裝置、出行裝置、家庭裝置;核心技術包括晶片、OS、AI;智能製造包括手機、汽車、大家電工廠;什麼是小米當前聚焦的核心,一目瞭然。在大家最關心的AI方面,小米自研MiMo系列大模型家族赫然呈現:推理大模型、視覺推理大模型、原生端到端音訊生成模型、端側視覺語言大模型、具身大模型。一個月前的11月12日,羅福莉在朋友圈正式官宣加入小米Xiaomi MiMo團隊。就在昨晚,小米剛剛發佈了最新的MiMo大模型MiMo-V2-Flash,性能媲美DeepSeek-V3.2,這也是羅福莉加入後MiMo團隊亮出的首個新成果。01. 羅福莉首次解讀:小米大模型三個重點方向算力和資料並非最終護城河羅福莉一上台就回到了“6億年前”,她說,AI正以非線性的方式重演人類大腦6億年的進化史。為什麼大模型“智能”起源於語言?在羅福莉看來,語言是人類思維和物理世界在符號空間的“投影”,而大模型成功解碼了人類思維在文字空間的投影。小米從“語言”出發,建構了面向Agent時代的語言基座模型MiMo-V2-Flash。在小米看來,超強的程式碼和工具呼叫能力是Agent溝通的高效“語言”,圍繞極致推理效率設計的模型結構是“高頻寬”的Agent協作的關鍵,全新後訓練範式則能夠保證高效穩定的擴展強化學習訓練。這三個方面是小米聚焦的重點。羅福莉特別提到,MiMo-V2-Flash模型並不大,但在程式碼和Agent測評基準測試中已經達到全球開源模型TOP2。MiMo-V2-Flash的推理效率是其突出優勢,在全球大致相同水位的頂尖模型速度和成本象限裡,MiMo-V2-Flash實現了低成本和高速度優勢。具體來看,小米圍繞極致推理效率來設計模型結構,採用了Hybrid SWA架構,固定KV Cache,增強長文推理,此外,團隊採用3層MTP推理加速平行Token驗證,實現推理速度2-2.6倍的提升。在全新後訓練範式方面,團隊採用了Dense&Token-Level的強化學習。當前MiMo-V2-Flash已經初步具備了模擬世界的能力,比如通過HTML寫作業系統、模擬太陽系、畫一顆聖誕樹。今天發佈會現場,羅福莉宣佈MiMo-V2-Flash發佈即開源,模型權重、技術報告都開源,API限時免費。對於未來的Agent發展,羅福莉提到,下一代智能體系統,不是一個“語言模擬器”,而是一個真正理解我們世界、並與之共存的“智能體”。Agent執行從“回答問題”到“完成任務”,具有記憶、推理、自主規劃、決策、執行的能力。Omni感知統一多模態感知,為AI理解物理世界打下基礎,嵌入眼鏡等智能終端、融入日常工作流。在通往AGI的路上,羅福莉團隊希望補全缺失的演化拼圖,單純Scaling UP參數量不夠,他們要讓LLM回到“演化課堂”,補上它跳過的關鍵學習步驟。簡單來說,他們非常看重AI與真實世界的互動,強調多模態。羅福莉特別提到,相比生物演化的穩固根基,AI的發展有些像“空中樓閣”。在她看來,AI進化的下個起點,一定是有一個能跟物理世界互動的模型。AI不僅要看懂畫面,還要理解背後的物理規律;AI不僅要推理文字,而是理解世界的運作邏輯。羅福莉說,這一觀點並非共識,行業中也有不少人認為語言就可以實現最終的AGI,比如Ilya。在她看來,算力和資料也並非最終的護城河,真正的護城河,是科學的研究文化與方法,是將未知問題結合模型最佳化轉化為可用產品的能力。羅福莉現場也開啟了“招聘會”,她提到,小米大模型Core團隊是研究、產品與工程深度耦合的年輕團隊,“小而美”卻充滿創業精神,他們極度好奇、追求真理。羅福莉提到,在她剛剛開始研究時,開源模型與頂尖模型的代差有三年,而今天這一差距已經縮短到了“數月”。他們相信開放原始碼的價值,開放原始碼的價值本質上是一種分佈式的技術的加速的主義。在羅福莉看來,開源是實現AGI的普惠化,是確保所有人類的智慧共同進化的唯一路徑。未來,從資料的極致壓縮,到演算法的範式創新,再到與物理空間的深度連結,小米與全球AI共同定義未來。95後羅福莉本科就讀於北京師範大學電腦專業,碩士畢業於北京大學計算語言學研究所計算語言學專業。她曾在阿里巴巴達摩院主導開發了多語言預訓練模型VECO,並推動了AliceMind的開源工作,2022年入職DeepSeek,參與了MoE大模型DeepSeek-V2的研發。集諸多光環於一身,來到小米的羅福莉,其動向一直是業內關注的焦點。02. 結語:猛攻Agent基座模型小米人車家生態全力衝刺AIAI,顯然是整場小米生態大會圍繞的核心關鍵詞。面向AI未來,小米的機會點顯然不止於AI手機,手機、PC、穿戴、IoT、汽車,小米人車家全生態均能與AI深度融合,小米在大模型方面的AI基礎能力提升則進一步加速了這一處理程序。盧偉冰近日曾提到,小米AI大模型業務過去投入持續增長,“AI與現實世界深度融合”已被列為小米未來十年核心戰略。顯然,面對AI這場硬仗,小米已經做好準備All in,“兵馬和糧草”都在加碼籌備。 (智東西)