官方認證
北風窗
林呈應
何名
悄悄地告訴你
官方認證
陳學進
Hamson Chung
蔡慶龍 價值型投資
官方認證
小小天下
三條線屬鼠(三條線屬鼠)
林偉翔
蔡正華金錢道
官方認證
小星星
官方認證
美股艾大叔
官方認證
陳智霖分析師
官方認證
RexAA
官方認證
股市教練
江國中
宋文宗
易經交易攻守道~非凡錢線百分百固定來賓(2011~2017)~台灣、中國共4張分析師證照
愛車新世界
2026年985高校排名,前十格局穩定,北航第11,哈工大升至第12,南開超山大排第21,中國農大第24,中國海大第36
2026年的軟科榜單出爐了,在985高校中,前十名的格局都沒變,清北浙交復,加上南大、中國科大、武大、華科大、西交這些老面孔。有點意思的在後面,北航卡在第11,差口氣衝進前十,哈工大往上升到了第12,南開把山大給超了排到第21,我們來看看部分高校的情況。哈爾濱工業大學哈工大這次升到第12,看著都替它高興,學校本部在哈爾濱,航天、機械、材料、控制,那個拎出來都是國家隊水平。讓我覺得它最厲害的是深圳校區的佈局,哈工大深圳現在火得不行,分數線比本部還高,深圳校區的科研產出跟人才吸引力把整體資料拉了一截,排名上漲跟這個也有直接關係。南開大學VS山東大學今年南開超了山大,排到第21,這倆較勁也很多年了,經常一前一後。南開是老牌文科理科強校,化學、數學、經濟、歷史,說出去那個都是響噹噹的。這幾年南開在醫學這塊開始發力了,跟天津市好幾家三甲醫院簽了合作協議,臨床醫學和口腔醫學都在鋪攤子。山大呢,齊魯醫學院是它的王牌,文科理科工科醫科擺得齊,規模上比南開大一圈。它的經費在985里面不算少,校區好幾個,濟南、威海、青島都有,被南開超了不是山大弱,是排名演算法指標,今年南開的分數稍微高一點。中國農業大學中國農大排第24,名次這幾年是穩步提升,屬於悶聲發大財的類型。學校的農業工程、作物學、畜牧學等全是A+,全國數一的存在,但凡跟“吃”沾邊的領域——從種子到養殖到食品加工,它基本全包了。不過說句大實話,現在很多考生對農業倆字還是有點偏見,一聽“農”字就不樂意報。中國農大的錄取線在985里面算低的,性價比是真的高。你進去學它的食品科學或者生物工程,出來進中糧、正大這種企業,或者考食藥監的公務員,路子一點不窄,而且它在北京市區,位置也不差。中國海洋大學中國海大排第36,在一眾985里面算要靠後的了,但仔細看看資料,它全國排名漲了5名,不算少了。學校的海洋科學、水產這兩個學科是A+,全國說第二沒人敢說第一,問題是這倆行當跟人工智慧、電腦那種熱門專業一比,考生扭頭就走。如果你真對這行有興趣,報它沒毛病,中國海洋大學在青島,實驗室裝置是國家級的,科考船都好幾艘,國內搞海洋這一塊,它的畢業生閉著眼都能找到對口單位,自然資源部下屬的研究所、沿海省份的海洋局,包括中船重工那些企業,一堆中國海大出去的。冷門歸冷門,門檻高,同行少,競爭反而沒那麼激烈。綜合來看,今年985高校的排名還是比較穩定的,而且985本身就是塊金字招牌,不管排第幾,都有各自的優勢,但報志願這事吧,還是先想清楚自己要啥,排名可以參考,不要拿它當人生指南針。你對2026年985高校排名有什麼看法呢?(縱觀時光記)
固態電池:下一個光模組——兆賽道的爆發前夜
一、核心邏輯:為什麼固態電池是“下一個光模組”?2025年,A股市場正上演一場熟悉的類股輪動劇本:當光模組指數從高位回呼17%、估值觸及70倍歷史峰值時,固態電池指數逆勢上漲超10%,先導智能、億緯鋰能等龍頭企業股價飆升逾40%。市場資金正從AI算力賽道向新能源高端製造領域輪動,而固態電池憑藉清晰的產業化路徑與爆發潛力,被普遍視為具備“光模組式”增長韌性的超級賽道。二者的相似性不僅體現在技術迭代關鍵期與類股輪動節奏上,更源於產業周期的深層共振,具體對比如下:五礦證券指出,當前全固態電池的產業階段,類比於新能源車2009-2010年“十城千輛”示範期,而光模組已進入類似新能源車2020-2022年的爆發期。這意味著,固態電池正處於爆發前夜,2025-2027年的產業化處理程序,有望複製光模組2023-2025年的滲透率躍升軌跡,開啟規模化增長周期。二、技術突破:從實驗室到量產線的關鍵跨越2.1 技術路線分化與主流選擇當前固態電池技術呈現“三足鼎立”格局,但經過行業多輪驗證,硫化物路線已成為頭部企業的共識選擇,具體路線對比如下:硫化物路線因性能最接近液態電池,成為寧德時代、比亞迪、豐田等頭部企業的重倉押注方向。其中,廣汽集團已明確將硫化物路線作為全固態電池的主要技術方向,計畫2026年實現裝車應用,進一步鞏固了該路線的主流地位。2.2 量產時間表:2025-2030年關鍵節點當前固態電池已進入產業化加速期,從半固態到全固態的迭代節奏清晰,關鍵時間節點如下:2025年(當前):半固態電池規模化裝車元年上汽智己L6、蔚來ET7已率先搭載半固態電池;衛藍新能源360Wh/kg半固態電池裝車量突破1.2GWh;2025年Q1,新能源汽車半固態電池搭載率升至22%,較2023年的5%實現大幅提升。2026年:混合固液電池量產元年混合固液電池出貨量預計達15GWh;廣汽集團全固態電池將搭載於昊鉑車型,續航突破1000公里;億航智能eVTOL固態電池實現商業化落地。2027年:全固態電池產業化元年寧德時代、比亞迪啟動全固態電池小批次生產;長安汽車開展固態電池裝車驗證,能量密度目標達400Wh/kg;固態電池在人形機器人領域實現初步規模化應用。2030年:大規模量產期全球固態電池出貨量超600GWh,市場規模突破2500億元;在儲能領域滲透率達2%;電芯成本降至$110/kWh以下,具備規模化替代液態電池的條件。三、五大應用場景:從動力到全場景滲透固態電池憑藉高能量密度、高安全性、長循環壽命等核心優勢,正逐步滲透至新能源汽車、低空經濟、人形機器人等多場景,形成“基本盤+高增長+藍海市場”的多元佈局。3.1 新能源汽車(核心基本盤)市場地位:2024年,電動汽車佔固態電池應用市場的33%,是當前最大單一應用場景,也是固態電池產業化的核心載體。產業化進展:高端車型先行:蔚來ET7搭載150kWh半固態電池包,續航突破1000公里;上汽智己L6配備准900V超快充固態電池,解決充電慢痛點;價格帶下沉:名爵MG4搭載半固態電池,定價切入10萬級主流價格帶,標誌著固態電池商業化實現關鍵突破;續航革命:廣汽集團預計2026年搭載全固態電池的車型,續航突破1000公里,徹底解決新能源汽車里程焦慮。長期空間:預計2030年,固態電池在動力電池領域的滲透率突破10%,成為中高端新能源車型的標配。3.2 低空經濟與eVTOL(高價值量場景)技術適配性:eVTOL(電動垂直起降飛行器)對能量密度(>400Wh/kg)和安全性要求極高,固態電池是目前唯一能滿足其技術標準的動力來源,成為低空經濟產業化的核心支撐。關鍵突破:億航智能已完成全球首次eVTOL固態電池飛行試驗,計畫2026年實現商業化落地;寧德時代與峰飛航空深度合作,聯合開發航空級固態電池,能量密度目標達500Wh/kg;孚能科技第二代eVTOL半固態電池能量密度達320Wh/kg,已實現批次交付;國軒高科是國內唯一實現低空飛行器動力電池規模化量產的企業。市場規模:預計2026年eVTOL市值空間達95億元,2031年其配套電池市場規模有望突破百億級。3.3 人形機器人(新興增量市場)應用優勢:相較於傳統鋰電池,固態電池可為人形機器人提供更長續航(提升50%)、更高安全性,同時其輕薄化特性可最佳化機器人內部空間佈局,適配靈活運動需求。產業化時點:2025-2026年,固態電池在人形機器人領域已進入初步實踐階段;廣汽集團第三代人形機器人GoMate計畫2026年投產,搭載全固態電池,續航可達6小時,能耗較傳統方案降低80%;孚能科技已與國內頭部人形機器人企業對接需求,推進產品適配。長期空間:德銀預測,2035年人形機器人市場規模或達750億美元,固態電池將成為其主流動力解決方案。3.4 儲能系統(長尾藍海市場)技術適配性:固態電池的高安全性、長循環壽命(超3000次)、寬溫域特性,與電網儲能、工商業儲能的核心需求完美契合,可有效解決傳統鋰電池儲能的安全隱患。示範項目:南都電源推出783Ah超大容量儲能固態電池,循環壽命不低於10000次,能量效率超95%,已應用於示範性儲能項目;當前固態電池在儲能領域仍以配套示範性項目為主,預計2030年滲透率達2%左右。成本門檻:需將電芯成本降至1.2元/Wh以下,才能大規模替代鉛酸電池,實現儲能領域的規模化應用。3.5 消費電子(商業化試驗田)應用優勢:固態電池的高能量密度、柔性封裝、輕薄化特性,可適配智慧型手機、平板電腦、可穿戴裝置等消費電子的輕量化、長續航需求,是商業化落地的先行場景。滲透預期:SMM預測,消費電池領域固態電池滲透率有望率先突破10%;長期來看,預計2037年消費電子將佔固態電池市場份額的40%,成為重要應用場景。四、市場規模:從百億到兆的躍遷隨著技術迭代加速與產業化推進,固態電池市場規模將實現跨越式增長,從當前百億級快速邁向兆級,成為新能源領域最具增長潛力的賽道之一。4.1 全球市場規模預測出貨量增長軌跡尤為顯著:從2023年全球1.6GWh躍升至2030年614.1GWh,年均複合增長率高達123%,彰顯賽道的高增長潛力。4.2 中國市場規模2024年:市場規模達95億元,2021-2024年年均複合增長率高達216.4%;2026年:預計市場規模達到318億元,保持高速增長;2030年:出貨量有望超過65GWh,較2024年的7GWh實現近10倍增長。4.3 應用場景佔比演變隨著各場景產業化推進,固態電池應用結構將逐步最佳化,呈現“動力主導、多元協同”的格局:2025-2027年:動力電池(70%)+ 低空經濟/無人機(20%)+ 消費電子(10%);2028-2030年:動力電池(60%)+ 低空經濟/機器人(25%)+ 儲能(10%)+ 消費電子(5%);2030年後:動力電池(50%)+ 儲能(20%)+ 消費電子(20%)+ 低空/機器人(10%)。五、產業鏈最大贏家:誰將複製“中際旭創”?類比光模組龍頭中際旭創,憑藉技術儲備、供應鏈管理與低成本製造能力,成為賽道“不可替代的贏家”,固態電池賽道各環節龍頭企業正加速崛起,有望複製這一成長路徑,具體可關注三大核心環節:5.1 電池龍頭:技術路線的定義者5.2 材料環節:高壁壘的核心賽道固態電池材料環節技術壁壘高、價值量提升顯著,是產業鏈中最具投資價值的細分領域之一,具體標的與邏輯如下:5.3 裝置環節:新工藝的最大受益者固態電池的製造工藝與傳統液態電池存在本質差異,現有液態電池產線無法相容,需全新專用裝置,裝置環節將成為新工藝落地的最大受益者:等靜壓裝置:核心解決固-固介面接觸問題,先導智能等企業已率先佈局;干法電極裝置:無需溶劑,可降低生產成本,裝置投資強度是傳統產線的數倍;鋰金屬負極裝置:重點包括精密塗布、沉積裝置,是鋰金屬負極量產的核心支撐。市場規模:預計2030年,固態電池裝置市場規模將達1079.4億元,成長空間廣闊。六、風險與挑戰:爆發前的最後一公里儘管固態電池賽道前景廣闊,但當前仍處於產業化前夜,面臨成本、工藝、供應鏈三大核心挑戰,是實現規模化爆發的“最後一公里”。6.1 成本瓶頸:當前為液態電池的6-8倍成本過高是當前制約固態電池規模化應用的核心瓶頸,其中硫化物電解質佔成本比重最高:當前成本:固態電池電芯成本約1.5-2.5元/Wh,而傳統液態電池僅0.3-0.5元/Wh,差距達6-8倍;降本路徑:主要依賴規模效應(2030年成本目標降至$110/kWh)、製造工藝最佳化、材料體系迭代三大方向。6.2 製造工藝:良率與一致性挑戰固態電池的製造工藝複雜度遠超液態電池,良率與產品一致性成為產業化關鍵難點:固-固介面接觸:固態電池固-固介面接觸面積僅為液態電池的1/10,導致內阻劇增,影響電池性能;干法電極工藝:目前干法電極良率偏低,且裝置投資規模大,需搭建全新產線,進一步推高初期投入;鋰金屬負極:鋰枝晶生長易導致電池短路,需配合固態電解質實現協同抑制,技術難度較高。6.3 供應鏈成熟度:中試線到量產線的跨越2025-2026年是固態電池中試線密集落地期,但從實驗室到規模化量產仍需時間沉澱:頭部企業進度:寧德時代、比亞迪等龍頭企業計畫2027年啟動全固態電池小批次生產,距離大規模量產仍有差距;全場景滲透:預計2030年後,隨著成本下降與工藝成熟,固態電池才能實現規模化降本與全場景廣泛滲透。七、投資結論:爆發前夜的佈局窗口類比光模組的投資節奏,固態電池當前正處於“2023年光模組”的關鍵階段——技術路線基本確定、產業化即將爆發、估值處於相對窪地,是佈局的黃金窗口。7.1 時間窗口2025年下半年-2026年:半固態電池規模化裝車,類股估值持續提升期;2027年:全固態電池裝車驗證,技術路線進一步確認期;2028-2030年:成本持續下降、滲透率加速提升,企業業績集中兌現期。7.2 配置策略結合賽道發展邏輯與企業競爭力,建議重點關注四大方向:電池龍頭:寧德時代、比亞迪、億緯鋰能(技術路線主導者,具備規模化量產優勢);材料龍頭:聚焦硫化物電解質、鋰金屬負極、鋁塑膜等高壁壘環節,把握價值量提升機遇;裝置龍頭:先導智能等(新工藝落地的最大受益者,享受產線建設紅利);應用場景龍頭:低空經濟(億航智能)、人形機器人(廣汽集團),把握新興場景增量。7.3 關鍵跟蹤指標佈局過程中,需重點跟蹤四大核心指標,把握賽道節奏:裝車量資料:每月半固態電池裝車量及滲透率變化,反映產業化進度;成本曲線:硫化物電解質價格、電芯成本下降速度,決定規模化替代節奏;中試線進展:頭部企業產線良率、產能爬坡情況,驗證工藝成熟度;政策催化:安全新國標落地進度、低空經濟相關政策力度,助力場景滲透。結語2025-2027年,固態電池正站在爆發的前夜,而這一次,賽道的廣度(全場景滲透)和深度(技術壁壘與價值量)或許將超越光模組,成為新能源時代最具確定性的兆級機會。本文資料來源:五礦證券、野村證券、中商產業研究院、SMM、各公司公告及公開資料 (連城論市)
梁文鋒的風骨,就是DeepSeek的根基
用最有效的方式幫助企業解決問題、創造價值做一名“企業文化好醫生”4月24日,DeepSeek V4上線。沒有發佈會,沒有鋪天蓋地的宣傳,只是發了一份58頁的技術報告。這份報告裡,DeepSeek自己寫了這麼一句話:“Nevertheless, its performance falls marginally short of GPT-5.4 and Gemini-3.1-Pro, suggesting a developmental trajectory that trails state-of-the-art frontier models by approximately 3 to 6 months.”翻譯過來:我們比最前沿的閉源模型,還落後3到6個月。開源最強,但自曝落後。這種坦誠,比任何PR稿都更能看清這家公司的底色。△圖片來源於網路500天的“換心臟”:從輝達到昇騰2025年年中,DeepSeek面臨一次巨大挑戰。不是模型崩了,是“心臟”要換——訓練框架從輝達遷移到華為昇騰。這相當於在高速公路上一邊開車一邊換發動機。黃仁勳說過一句話:DeepSeek基於華為平台開發模型,“對美國來說將是一個糟糕的結果”。△圖片來源:百度百科黃仁勳9天後,V4適配昇騰完成,全面上線。被唱衰、被挖角V4發佈前,DeepSeek被唱衰了500多天。“Next Week”成了網友調侃的梗。同期,團隊核心人員被大廠挖角,開出的價碼是DeepSeek的幾倍。梁文鋒的反應?他早在採訪裡說過:“我們選人的標準一直都是熱愛和好奇心,很多人對做研究的渴望,遠超對錢的在意。”△圖片來源:百度百科梁文鋒因為他知道,留下的才是真正相信這件事的人。V4發佈後,業內評價:開源模型中性能最接近閉源旗艦的代表。他不藏著掖著。缺點也公開說,差距也公開說。“不誘於譽”——別人誇你不飄。“不恐於誹”——別人罵你不慫。“率道而行”——走自己的路。“端然正己”——把自己做好。1號位的風骨,就是企業文化的根基梁文鋒的風格,決定了DeepSeek的底層程式碼:關於開源:“在顛覆性的技術面前,閉源形成的護城河是短暫的。即使OpenAI閉源,也無法阻止被別人趕超。”關於創新:“過去三十年,我們都只強調賺錢,對創新是忽視的。創新不完全是商業驅動的,還需要好奇心和創造欲。”關於中國AI:“中國AI不可能永遠停留在跟隨階段。如果這個不改變,中國永遠只能是追隨者。”這些話不是PR稿,是他真的在做的。△圖片來源:百度百科梁文鋒梁文鋒不是什麼商學院的案例他是一個相信“中國必須有人站到技術前沿”的工程師,是一個願意把1.38億匿名捐出去的普通人,是一個在V4發佈時主動承認“落後3到6個月”的創始人。1號位的風骨,就是企業文化的根基。他有一句話,值得每個做企業的人記住:“當這個社會讓硬核創新的人功成名就,群體性想法就會改變。我們只是還需要一堆事實和一個過程。”不誘於譽,不恐於誹,率道而行,端然正己。 (大美嘮文化)
DeepSeek和中國算力下了好大一盤棋
DeepSeek與中國算力合力,實現token成本的大幅降低後,又會反向利多AI應用市場,催生更大的市場空間。兩天兩次降價,效率成了DeepSeek最深護城河2026年4月的最後一個周末,中國AI產業被一連串消息徹底點燃,而消息背後的主角只有一個,DeepSeek。4月24日,DeepSeek正式發佈V4系列預覽版,同步開源Pro與Flash兩款模型,均支援百萬token超長上下文。緊接著的25日與26日,DeepSeek連續兩晚出手降價——先是V4-Pro限時2.5折,再是全系API輸入快取命中價格永久降至首發價的十分之一。兩天兩次調價之後,V4-Flash每百萬tokens輸入快取命中價格僅為0.02元,V4-Pro為0.025元,創下全球大模型價格新低。這樣一場精心策劃的閃電戰,背後是DeepSeek長達一年的艱難求索。但如果依舊將目光放在“價格戰”的淺層敘事,就低估了DeepSeek此番出手的深意。V4的降價已經無關於燒錢換市場,其更大的意義是底層架構效率革命帶來的成本變化。正如高盛Ronald Keung團隊在最新研報中所指出的,“V4的核心意義在於以更低成本支援更複雜的智能體應用落地,從而打開AI應用規模化的新空間”。在DeepSeek-V4的技術報告裡,效率是極致的。V4-Pro在100萬token上下文場景下,單token推理所需浮點運算量僅為V3.2的27%,KV快取佔用僅為10%;V4-Flash更為激進——FLOPs降至10%,KV快取壓縮至7%。這意味著什麼?通俗地說,過去跑一條百萬字上下文需要三台機器的算力,現在一台機器就能從容應對,而且記憶體開銷僅是過去的十分之一。效率飛躍背後,有V4在架構層面的三項關鍵創新:混合注意力機制(CSA/HCA)、流形約束超連接(mHC),以及Muon最佳化器。其中最核心的突破在於混合注意力——CSA(壓縮稀疏注意力)沿序列維度壓縮KV快取後執行稀疏注意力計算,每m個token的KV快取被壓縮為一條記錄;HCA(重度壓縮注意力)則施加更激進的壓縮策略,將m'個token的KV快取合併為單條記錄,但仍保留稠密注意力。這套組合拳在幾乎不影響模型性能的前提下,將長上下文場景的計算與儲存成本砍掉了一個數量級。更精妙的設計體現在細節處:對KV條目採用混合儲存格式,旋轉位置編碼維度保持BF16精度,其餘維度使用FP8精度,這一項便將KV快取容量壓縮近半。閃電索引器內部的注意力計算以FP4精度執行,進一步加速長上下文下的注意力運算。技術壓縮效率,效率兌現成本。這才是DeepSeek敢於連續降價的真正底牌。理解了這一邏輯,便能看穿此次降價的產業含義:相比於其他AI大模型降價拚命上桌,這一次DeepSeek直接用技術優勢主動建構了成本壁壘。V4-Flash以0.02元/百萬tokens的價格橫掃市場背後,每一分錢的降價都有底層架構最佳化作為支撐,而不是資本燒錢補貼的邏輯。競爭對手要跟進,首先得在技術上追平這份效率——而這顯然不是一朝一夕之功。從模型等晶片,到晶片靠模型與兩次降價幾乎同步發生的,是國產晶片陣營的集體“起立”。V4發佈當日,華為昇騰、寒武紀、海光資訊、摩爾線程、沐曦股份、崑崙芯、平頭哥真武、天數智芯8家國產AI晶片品牌,以及輝達,均宣佈完成對DeepSeek-V4的適配。尤其值得注意的是,這是大模型產業首次實現“Day 0”等級的全端適配:模型發佈即適配上線,晶片廠商不再需要數月的“追逐式”偵錯周期。這裡有一個細節必須拆解清楚。DeepSeek官方在技術報告中表示,“我們在輝達GPU和華為昇騰NPU兩個平台上驗證了細粒度EP(專家平行)方案,在通用推理任務中實現1.50至1.73倍加速;在延遲敏感場景下最高達到1.96倍”。這是DeepSeek歷史上首次將國產晶片與輝達GPU並列寫入硬體驗證清單,確立對等地位。華為昇騰的反應也十分迅猛。昇騰官方在B站直播中稱,在推理部署層面,昇騰950PR平台針對V4實現了多項深度適配。量化方面,原生的硬體加速精度明確支援MXFP8與MXFP4等低精度資料格式,兼顧模型精度與記憶體佔用最佳化。算子層面,華為官方宣佈昇騰950通過融合kernel與多流平行技術,大幅降低了混合注意力機制的計算和訪存開銷,顯著提升了推理性能。而MoE模組中路由專家與共享專家的計算重疊等深度最佳化,則進一步確保了兆參數模型在國產硬體上的高效平穩運行。圖|昇騰直播間截圖寒武紀則在基於自研NeuWare軟體生態與vLLM框架上,完成了對V4的“Day 0”適配並同步開源自研算子庫。這已是寒武紀連續第二次在DeepSeek新模型發佈首日便推出適配方案,其技術迭代速度同樣不容小覷。更有說服力的訊號來自財務上的持續好轉,國產開源大模型的極速發展,正在把中國算力產業拉入良性發展的通道里。4月26日晚,摩爾線程發佈2026年一季報:一季度營業收入7.38億元,同比增長155.35%;歸母淨利潤2935.92萬元,同比扭虧為盈。這家被稱為“中國輝達”的國產GPU廠商,此前因研發投入高達營收86.68%而備受市場質疑,如今終於交出了一份逆轉的答卷。與此同時,摩爾線程還與某客戶簽訂了金額達6.6億元的誇娥智算叢集銷售合同。寒武紀此前發佈的年度業績快報亦顯示已率先實現盈利,沐曦股份則呈現出虧損持續縮小的態勢。三家國產AI晶片代表企業同步進入業績改善通道,已經是十分有力的回應。國產算力生態臨界點的到來當DeepSeek的技術效率革命與國產晶片的產能釋放在同一時間窗口交匯,一條完整的產業閉環開始浮出水面。中銀國際在4月26日發佈的研報中判斷:“DeepSeek V4的發佈標誌著國產大模型已基本跑通全端國產化,理論上已形成從底層硬體、基礎軟體、平台服務到上層應用、安全體系的完整技術鏈條,國產算力類股或迎來自己的質變臨界點。”反過來看,DeepSeek與國產算力實現合力,在大幅降低token成本後,又會反向利多AI應用市場,催生更大的市場空間。據華泰證券表述,“市場容易將V4理解為‘降本壓低算力、儲存需求’,但更重要的邊際變化在於長上下文成本下降後,複雜Agent、多文件分析、長周期任務、線上學習等場景可用性提升,推理呼叫量與儲存訪問頻次有望擴張。”換句話說,降價不會縮減蛋糕,還會做大蛋糕——越便宜用得越凶,總呼叫量反而會暴增。同樣在4月24日,新版本OpenClaw 發佈,直接接入了最新的DeepSeek V4雙版本,並將V4 Flash設定為了默認大模型。據OpenRouter平台資料,DeepSeek V4 flash今日呼叫量較前一天上漲了62%。值得一提的是,DeepSeek已明確將華為昇騰950超節點量產納入其商業路徑,並預告下半年實現大規模供貨後API定價將迎來顯著下降。這意味著當前的降價可能只是一個預告,真正的主菜還在後面。資本市場已作出熱烈反應。4月27日早盤,A股算力晶片概念延續強勢,CPU方向領漲,海光資訊、摩爾線程等跟漲;港股半導體類股領漲,瀾起科技漲超6%,中芯國際漲近5%。產業鏈上下游——從晶片設計到伺服器整機,從算力租賃到AI應用——都在重新定價這一歷史性的產業變局。這個4月,DeepSeek以一組硬核效率資料為矛、以兩次精準降價為鼓,打出明牌——AI的長上下文時代已經到來,而它的“高速公路”將由國產算力鋪就。對那些剛剛登陸科創板的國產晶片企業而言,這個春天確實比往年都暖。 (鳳凰網科技)
WTO出口榜單出爐!中國斷層式第一,超過美、德、日三國總和!
最近,WTO發佈了2025年全球出口經濟體TOP30的榜單。我看了一眼資料,只想說:現實,永遠比任何劇本都更具戲劇性。當全世界都在談論供應鏈轉移的時候,這份榜單卻像一盆冷水,澆醒了很多還在做白日夢的人。它赤裸裸地揭示了一個事實:全球貿易的重心, 不僅沒有離開中國,反而在以一種更強大的姿態,向東傾斜。資料來源:WTO / 製圖:騰道01. 斷層式領先不是第一,是“唯一”2025年,全球商品出口總額26.3兆美元。在這盤大棋局裡,前三名,中美德拿走了超過三分之一的份額。真正讓人震撼的,是頭部的差距,中國大陸,以3.78兆美元的出口額,毫無懸念地繼續領跑。資料來源:WTO / 製圖:騰道美國,作為全球最大的消費市場,其出口額為2.2兆美元。德國、日本,這兩個老牌工業強國,緊隨其後。這組對比非常殘酷:中國的出口規模,是美國的1.7倍,更是德國和日本加起來的1.5倍!如果你覺得這還不夠直觀,那我們再把視野放寬一點。如果把中國香港和台灣這兩個單獨關稅區也計算在內,整個大中華區的出口體量將飆升至5.17兆美元。這是什麼概念?這意味著,我們一個“家庭”的出口總額,超過了美國、德國、日本這三個世界級經濟體的總和。在全球貿易保護主義盛行的當下,這一成績殊為不易,但也足夠說明,沒有任何一個國家,能在製造和出口的廣度與深度上,與中國比肩。02. 亞洲時代不可逆轉的東移把目光從國家移到區域類股,你會發現一個更宏大的格局正在形成。歐洲作為全球貿易的核心樞紐,在全球出口前30大經濟體中獨佔12席,總出口額高達7.7兆美元。然而,其傳統製造業優勢正面臨挑戰。2025年,歐盟對華貨物貿易逆差突破2900億美元,首次超越美國,成為中國最大的貨物貿易順差來源國。這種依賴關係在德國表現得尤為顯著:2019年德國對華尚有230億美元的貿易順差,但到2025年已逆轉為約255億美元的逆差。資料來源:WTO / 製圖:騰道亞洲,則完全是另一番景象。“亞洲崛起”不再是口號,而是實打實的資料洪流。亞洲在TOP30中佔據了13席,合計出口超過10兆美元,佔TOP30總額的46.2%。資料來源:WTO / 製圖:騰道更重要的是,2025年亞洲的出口增速達到了9.5%,遠超全球7.2%的平均水平。從東亞的中日韓,到東南亞的越南、馬來西亞,再到南亞的印度和中東的阿聯、沙烏地阿拉伯,一股前所未有的合力正在形成。全球貿易的重心,正在以前所未有的速度向東轉移。 這不是預測,這是正在進行時。03. 東方不亮西方亮我們正在贏得未來很多人問我:“騰哥,失去了美國市場,中國外貿還有戲嗎?”說實話,這種焦慮大可不必。資料,已經給出了最有力的回擊。我們正在成功地進行一場偉大的“市場置換”。2025年,我們對新興市場的出口占比已經提升到了49.1%,幾乎佔據半壁江山。而對美國市場的依賴度,則從去年的14.6%下降到了11.1%。資料來源:海關總署 / 製圖:騰道這說明什麼?說明中國製造的競爭力,已經不再依附於任何一個單一市場。無論是發達市場還是新興市場,中國商品都成了剛需。越來越多的外貿老闆早已及時轉型,避開內卷紅海,發力拉美、中東歐等新興市場;放棄低價拚殺,深耕高附加值、差異化產品。就像常州貝特燈具製造有限公司,放棄美國市場後,僅憑6人精簡小團隊,一年穩穩做出6000萬外貿業績。更關鍵的是,我們的出口結構正在發生質變:新能源、新材料、航空航天、高端裝備,正在成為新的增長引擎。資料來源:海關總署 / 製圖:騰道具身智能、生物製造、量子科技……這些未來產業,我們正在搶先佈局下一輪工業革命。正如摩根大通預測的那樣,到2049年,中國出口占全球的比例可能穩定在17%左右。這不僅是一個數字的預測,更是對中國製造韌性與潛力的最大肯定。 (騰道Tendata官方帳號)
封死漲停!三大利多來襲,整條賽道狂飆
早盤,明微電子開盤後7分鐘,20%封死漲停板,光莆股份連續兩個20%漲停,日聯科技亦20%漲停。芯原股份、寒武紀、沐曦股份、海光資訊等知名晶片股全線大漲。消息面上,主要有三大利多:首先,高層在講話中明確指出,要多路線佈局前沿技術探索,全鏈條推進關鍵核心技術攻關,不斷鞏固人工智慧發展領先地位;其次,TrendForce資料:二季度DRAM合約價環比上漲58%—63%,NAND Flash合約價環比上漲70%—75%;最後,AI晶片整個類股一季報業績好於預期,AI硬體逐步從炒作到業績兌現,明微電子、沐曦股份以及此前的摩爾線程皆有不錯表現。01. 業績兌現潮:一季報成為最強“催化劑” 寒武紀:業績爆發式增長,營收淨利雙創歷史紀錄寒武紀4月29日披露的2026年一季報顯示,公司一季度營收達28.85億元,同比增長159.56%;歸母淨利潤10.13億元,同比增長185.04%,雙雙創下歷史最優紀錄。摩根士丹利指出,寒武紀一季度營收同比增長160%,超過了該行及市場的普遍預期,核心得益於思元590晶片的強勁出貨。更值得關注的是,寒武紀一季度預付款項環比激增155%至19億元人民幣,主要由新獲得的晶片生產訂單支撐,且其在中芯國際的代工生產已逐步穩定,預計出貨量從2026年第二季度起將迎來顯著增長。通達信主題庫---AI晶片芯原股份:訂單端突破性進展,AI算力訂單佔比超91%芯原股份4月29日披露的一季報同樣亮點突出:年內新簽訂單金額飆升至82.4億元,其中AI算力相關訂單佔比高達91.37%,主要聚焦雲側AI ASIC及IP賽道,這意味著國產晶片設計服務龍頭在AI算力浪潮中已佔據核心卡位,充足訂單儲備為後續業績兌現提供了強力支撐。摩爾線程:扭虧為盈,商業化處理程序提速國產GPU龍頭摩爾線程一季度實現營收7.38億元,同比增長155.35%,歸母淨利潤2935.92萬元,同比成功扭虧為盈。2026年一季度還斬獲6.6億元誇娥智算叢集大單,商業化處理程序不斷提速。02. 全球半導體景氣度飆升:AI需求從“炒作”進入“業績兌現”費城半導體指數創下32年來首次18連漲紀錄,月內累計漲幅超38%。英特爾一季度業績指引遠超預期,股價單日暴漲超27%,突破歷史高點,市值突破4700億美元。儲存晶片“超級周期”進入業績兌現階段三星電子4月30日發佈的2026年一季報堪稱“炸裂”:銷售額133.87兆韓元,同比增長69.16%;營業利潤57.23兆韓元,同比增長756.10%;淨利潤47.10兆韓元,同比增長486.68%。CPU供需失衡,價格中樞持續上行AI Agent應用爆發正加劇CPU供需失衡。當前AI資料中心的CPU與GPU配比約為1:4至1:8,而在智能體AI時代,這一比例預計將演變至1:1至1:2,CPU需求有望持續提升。03. 國產替代加速:從“試驗性使用”到“規模化替代”半導體裝置國產化率突破關鍵臨界點公開資料顯示,半導體裝置國產化率在2026年初突破了35%的關鍵臨界點,這意味著國內晶圓廠在新建產線時,與核心裝置的採購已實現從“試驗性使用”到“規模化替代”的轉變。SEMI預計,2026年至2029年全球12英吋晶圓廠裝置支出將持續增長,對應規模將達1330億、1510億、1550億、1720億美元。外部封鎖倒逼加速美國眾議院外交事務委員會近期通過的MATCH法案,不僅禁止向中國出售關鍵半導體製造裝置,還禁止對已售裝置提供維修、保養和技術支援。外部封鎖越緊,國產替代需求越迫切,供給與需求兩端同時發力,使整個半導體產業鏈同步受益。國產AI晶片市場份額持續提升IDC資料顯示,2025年中國雲端AI加速器市場,中國本土晶片廠商拿下近41%的份額,總出貨量高達約165萬張。里昂證券估算,國產AI晶片的本地化率在2026年約為30%至40%,預計到2030年將升至60%至70%。 (通達信趨勢財經)
Google Q1電話會省流:Google雲暴漲63%,廣告基盤穩如泰山!(Alphabet單季營收超千億背後的算力底牌)
2026年4月30日,Alphabet(Google)發佈2026年第一季度財報,公司高管 Sundar Pichai(CEO)、Philipp Schindler(CBO)、Anat Ashkenazi(CFO)參加電話會議。🎙️ 一、 電話會省流總結(高管的心裡話)🔥 重點 1:算力瓶頸仍是最大的“幸福煩惱”,ROI決定資源分配🗣️ 高管原話: “顯然,我們在短期內受到了算力的限制。舉個例子,如果我們能夠滿足所有需求,我們的雲業務收入還會更高……在資源受限的環境下,當我們在所有這些機會中進行分配時,我們是基於穩健的投資回報率(ROIC)框架來運作的。”🧠 大白話翻譯: 算力依然不夠用!我們現在不是賣不出去雲服務,而是卡在算力上限導致有錢賺不到。地主家也沒有餘糧去無腦鋪攤子了,未來的每一分錢算力投資都要精打細算,誰能給公司賺回真金白銀(更高的ROI),算力就優先分配給誰(比如給GCP大客戶或核心產品)。🔥 重點 2:AI基建成本跨過拐點,大模型搜尋不再是“賠錢賺吆喝”🗣️ 高管原話: “即使我們將新的AI功能引入搜尋結果頁,我們在過去5年裡也將搜尋延遲降低了35%以上。而且自從將AI概覽和AI模式升級到Gemini 3之後,我們將核心AI回覆的成本降低了30%以上,這得益於硬體和工程領域的持續突破。”🧠 大白話翻譯: 搞AI搜尋最燒錢的階段正在過去。我們通過底層的軟硬體最佳化,不僅讓AI回答得更快,還把單次大模型呼叫的成本砍掉了將近三分之一。這意味著AI搜尋在商業模式上徹底跑通了,規模化盈利的拐點已至。🔥 重點 3:雲業務成超級印鈔機,B端市場迎來爆發🗣️ 高管原話: “Google雲部門交付了極其出色的業績……雲服務收入在所有關鍵領域均加速增長,飆升63%至200億美元……雲業務的未交付訂單(backlog)環比幾乎翻倍,達到超過4600億美元。”🧠 大白話翻譯: Google雲徹底殺瘋了!單季狂攬200億美元,更恐怖的是手裡握著4600多億美金的客戶訂單還沒消化。企業客戶都在搶著排隊買我們的AI基礎設施和Gemini企業版,這是我們未來幾年業績最硬的底牌。🔥 重點 4:算力硬體的“雙重保險”戰略🗣️ 高管原話: “我們定製的TPU、Axion CPU以及最新的輝達GPU繼續構成業內最廣泛的計算選項。輝達GPU是我們AI加速器組合的核心部分,我們將首批提供Vera Rubin NVL72……此外我們還推出了第八代TPU。”🧠 大白話翻譯: 面對輝達,我們的策略是“全都要”且“兩手抓”。最頂配的輝達新卡我們要搶首發,但自家的第八代TPU也必須猛推。通過算力底座的多元化,我們要把AI時代的定價權和供應鏈安全死死攥在自己手裡。🔥 重點 5:從“提供連結”到“AI包辦”的商業模式重塑🗣️ 高管原話: “我們認為智能體(Agentic)體驗是附加的,它將改變我們從‘發現’到‘決策’的轉變方式……我們正在智能體工作流中精心設計空間,讓使用者能在購物旅程中看到真正有價值的元件,這超越了傳統的代理模式。”🧠 大白話翻譯: 未來的搜尋引擎不再是給你一堆藍色連結讓你自己找,而是讓AI智能體直接幫你把事辦了(比如買單、預訂)。既然使用者的習慣變了,我們的廣告模式也要跟著變,在這個全新的“包辦式”流程裡,我們已經想好怎麼重新收商家的過路費了。二、 國內產業鏈聯動與行業展望🔗 產業鏈影響: Alphabet 在一季度砸下了高達 357 億美元的資本開支(CapEx),且明確表示約 60% 用於伺服器(重點是AI計算)、40% 用於資料中心,同時龐大的雲業務訂單(Backlog)預示著這種等級的投入具有持續性。這不僅打消了市場對“AI基建見頂”的疑慮,更向國內供應鏈釋放了強烈的看多訊號。 高速增長的算力叢集和下一代 GPU/TPU 部署,將直接拉動國內光模組(特別是800G向1.6T及以上速率演進)、液冷溫控裝置(應對超高密度算力功耗)、以及AI伺服器代工、高速PCB/銅纜等細分賽道的需求。📍 相關 A 股/港股核心標的: 中際旭創(全球光模組龍頭)、工業富聯(AI伺服器及網路裝置代工核心)、滬電股份(高端算力PCB)、英維克(資料中心液冷溫控龍頭)。🔭 核心觀察點(未來推演與風險提示):增長邏輯: Google的增長邏輯已發生實質性蛻變,從過去極度依賴“搜尋廣告”單擎驅動,正式確立了“廣告基盤穩固 + AI雲服務狂飆 + AI端側訂閱(超3.5億使用者)”的三擎驅動模式。 (高管說了啥)
DeepSeek剛解決了AI視覺最後一塊拼圖:極低成本+精準視覺定位,AI接管電腦已無死角
DeepSeek多模態模式相信有很多人已經灰度到了,對應的技術報告也來了,可以說DeepSeek 解決了可靠且廉價的電腦代理的最後一個難題DeepSeek放出了一篇新論文,解決的是多模態大模型裡一個被長期忽視的根本性問題。不是看不清圖,而是說不清位置。論文名叫 Thinking with Visual Primitives(基於視覺原語的思考),來自DeepSeek、北大和清華的聯合團隊。paper:https://github.com/deepseek-ai/Thinking-with-Visual-Primitives/blob/main/Thinking_with_Visual_Primitives.pdf問題出在那裡現有的多模態大模型,推理過程基本被鎖死在文字空間裡。模型用Chain-of-Thought(CoT)一步步推導,聽起來很合理,但有個致命缺陷:語言本身是模糊的,它沒辦法精確指向圖像裡某個具體位置。比如你問模型:圖裡左邊那個小杯子旁邊的那個東西是什麼顏色?模型的語言推理鏈條很快就會亂掉,它"想著"一個物體,實際上卻已經搞混了另一個。這就是論文裡定義的Reference Gap(指代鴻溝)。和它對應的是另一個已經被廣泛研究的問題:Perception Gap(感知鴻溝),即模型看不清高解析度圖像裡的細節。前者已有不少工作在做,比如高解析度裁切、動態分塊。但後者一直沒有被正面解決。論文的核心判斷是:就算感知做到完美,只要指代還靠自然語言,模型在密集計數、複雜空間推理、拓撲導航這類任務上就會持續出錯,產生連鎖幻覺。DeepSeek解法:讓模型一邊想一邊指DeepSeek的方案叫 Thinking with Visual Primitives,思路:把空間標記,也就是點(point)和邊界框(bounding box),升格為"最小思維單元",直接插進模型的推理鏈條裡。人類數一堆密集的東西時,會用手指逐個點過去。這個框架做的事情和這個一樣:模型每推理一步,就可以在圖上"戳一下",把抽象的語言思維錨定到圖像的物理坐標上。兩種視覺原語各有分工:邊界框適合捕捉具體物體的位置和大小;點則更適合抽象的視覺指代,比如軌跡追蹤或拓撲推理中的路徑節點。架構:極致的token壓縮這套框架建立在一個對token效率做到極致的架構上。語言骨幹是 DeepSeek-V4-Flash,總參數284B,推理時啟動參數13B。視覺編碼用的是 DeepSeek-ViT,一個從頭訓練的ViT,支援任意解析度輸入。它先用14×14的patch大小把圖像切成patch token,然後在ViT輸出端用3×3空間壓縮,把每9個相鄰patch token合併成1個。進入LLM之後,還有一層 Compressed Sparse Attention(CSA) 機制,對視覺token的KV cache再壓縮4倍。整體下來的壓縮比是7056倍。舉個具體的數字:一張756×756的圖,原始像素展開是571,536個,經過patch embedding變成2,916個ViT token,3×3壓縮後變成324個,進入LLM後KV cache裡只剩81個視覺條目。如圖所示,處理一張800×800的圖,本文模型消耗約361個token(KV cache裡只有約90條),而Claude-Sonnet-4.6需要約870個,Gemini-3-Flash需要約1100個,GPT-5.4需要約740個。token用量不到競品的三分之一,但在7個基準測試上的平均分是77.2%,高於Gemini-3-Flash的76.5%和GPT-5.4的71.1%。訓練:四個階段,從專才到通才訓練流程分為預訓練和後訓練兩大階段預訓練目標是讓模型學會輸出視覺原語。訓練資料來自大規模網路爬取。僅在Huggingface上,團隊就用官方API篩選了帶有Object Detection或Grounding標籤的資料集,按熱度排名初篩,排除所有驗證集和測試集,再用LLM agent解析README檔案,統一格式。最終爬取了97,984個box grounding相關資料來源。原始資料質量參差不齊,團隊設計了兩步過濾流程:第一步是語義審查,用MLLM自動識別並丟棄三類問題資料:無意義的機器碼和亂碼標籤、無法泛化的私有實體(比如MyRoommate這類私人稱呼)、歧義縮寫和主觀評價(比如工業檢測裡的OK/NG)。這一步從97,984個源過濾到43,141個。第二步是視覺幾何質量審查,排除三類標註缺陷:嚴重漏標(漏標率超50%)、嚴重截斷或偏移(切掉了物體關鍵視覺特徵)、無意義的超大框(覆蓋超過90%圖像面積,通常是圖像分類資料被強行轉成檢測資料)。過濾後剩31,701個資料來源。最終通過類別均衡採樣,得到超過4000萬個高品質樣本。格式上,box grounding任務的prompt範本類似於:Locate TARGET in this image and report its bounding box coordinates,響應格式使用特殊token包裹坐標,坐標歸一化到0到999的離散整數。point任務同理,但響應不要求輸出物體名稱,以便將點標記擴展到軌跡等更抽象的概念。後訓練:冷啟動資料後訓練需要少量但高精度的冷啟動資料。團隊圍繞四類任務建構這些資料:1. 計數(Counting)分粗粒度和細粒度兩類,如圖粗粒度計數:聚合多個密集檢測資料集,過濾掉物體過密、框太小、召回率低的樣本,用MLLM生成推理內容,分三步走:意圖分析、批次定位(同時找出所有候選物體)、基於視覺原語統計求和。細粒度計數:因為公開資料集太少,團隊基於GQA資料集建構了專屬流程,用MLLM生成帶有屬性約束的計數問題,再合成包含視覺原語的推理鏈。同時建構了ground truth為零的負樣本,增強模型抗幻覺能力。冷啟動計數資料共約10,000條。2. 空間推理和通用視覺問答如圖所示,資料來源包括自然場景(基於GQA)和合成場景(基於CLEVR工具鏈,支援可控場景生成和多跳推理)。還建構了負樣本,當查詢的物體或關係不存在時,模型學會基於視覺證據給出忠實的拒絕回答。共約9,000條冷啟動樣本。3. 迷宮導航如圖所示,這是為瞭解決純語言CoT無法精準描述不規則形狀軌跡的問題。迷宮用DFS、Prim和Kruskal演算法生成,確保路徑不能被輕易猜到。設計了三種拓撲結構:矩形網格、同心圓形迷宮、六邊形蜂巢迷宮。同時設計了無解迷宮,方法是先生成有解迷宮,找到解路徑後,在路徑中段故意放置幾堵牆,使迷宮看似可解但實際需要完整搜尋才能確認無解。難度通過網格大小控制:簡單迷宮只需串聯少量本地連通性檢查,最難的噩夢級迷宮需要持續追蹤數百步而不丟失已探索區域資訊。推理內容記錄了基於DFS的探索過程,每一步都用point坐標錨定到圖像上。共生成460,000條冷啟動樣本。4. 路徑追蹤如圖所示,任務是在一堆相互纏繞的線條中,沿指定曲線追蹤到它的終點。圖像由多條貝塞爾曲線生成,每條連接一個標記起點和終點。關鍵挑戰在於交叉點消歧:在兩條線交叉的地方,模型必須判斷那個分支是目標曲線的延續。設計了純色統一風格模式,所有線條顏色和粗細相同,強迫模型只靠曲率連續性判斷,而不是靠顏色捷徑。推理內容用一系列坐標序列表示追蹤過程,在曲率大或交叉密集的區域坐標點更密,在平直段坐標點更稀疏,模仿人類在視覺複雜區域放慢注意力的行為。共生成125,000條冷啟動樣本。後訓練流程:專才訓練再合併後訓練採用專才訓練後合併的策略,分四個子階段:專項SFT:訓練資料由70%通用多模態和純文字資料、30%視覺原語專項資料構成。box(thinking with grounding)和point(thinking with pointing)分開訓練,避免在專項資料量較少時產生模式衝突,分別得到專才模型FTwG和FTwP。專項RL:對FTwG和FTwP分別獨立進行強化學習,使用GRPO演算法。設計了三類獎勵模型同時監督:格式RM(規則型,驗證視覺原語格式是否正確,同時檢查是否存在重複框)、質量RM(基於LLM的生成式獎勵模型,檢查回答冗餘、思維與回答是否一致、是否存在自相矛盾、獎勵駭客行為等)、精準性RM(針對不同任務定製)。計數任務的精準性獎勵採用平滑指數衰減函數,對接近正確的預測輕懲,對偏差大的預測重懲,而非簡單的二值精確匹配。迷宮導航的獎勵分解為探索進展、探索完整性、穿牆懲罰、最終路徑有效性、答案正確性五個分項,確保獎勵訊號密集且資訊豐富。路徑追蹤的獎勵包含雙向軌跡評估:正向懲罰偏離真實路徑的預測點,反向懲罰模型跳過的路徑段,兩者缺一不可。RL結束後,將資料池按難度分為三級:所有N次rollout全對(Easy)、部分對(Normal)、全錯(Hard),只選Normal級資料用於GRPO訓練。訓練完成得到專才模型ETwG和ETwP。統一RFT:用ETwG和ETwP對資料池做rollout,生成RFT資料,保留所有Normal級樣本,隨機子採樣5%的Easy級樣本防止災難性遺忘,重新從預訓練基礎模型初始化訓練一個統一SFT模型F。On-Policy Distillation(OPD):RFT模型F相比專才模型ETwG/ETwP仍有性能差距。用線上蒸餾彌合這一差距,讓學生模型基於自己生成的軌跡學習教師模型(ETwG和ETwP)的輸出分佈,使用全詞表logit蒸餾,損失函數為反向KL散度的加權求和。實驗結果模型在多個任務上達到前沿水平:計數任務:Pixmo-Count上以89.2%的精確匹配率超過Gemini-3-Flash的88.2%,在DS_Finegrained_Counting上以88.7%超過Qwen3-VL-235B-A22B的87.2%。空間推理和通用VQA:在SpatialMQA(69.4% vs 67.0%)、MIHBench(85.3% vs 83.5%)、DS_Spatial_Reasoning(98.7% vs 97.2%)上均排名第一。拓撲推理:這是本文最突出的貢獻之一。所有前沿模型在DS_Maze_Navigation上的得分都在50%上下浮動,而本文模型達到66.9%。DS_Path_Tracing上,本文模型56.7%,排名第二的GPT-5.4隻有46.5%,Claude-Sonnet-4.6是30.6%。論文指出,這說明多模態大模型在拓撲推理上仍有大量提升空間。定性結果方面,如圖所示,在使用邊界框作為視覺原語的任務上,模型展示了粗粒度計數、細粒度計數、反常識視覺問答(判斷天平兩側那個更重)、世界知識關聯(識別金門大橋後判斷附近是否有NBA球隊)、行動建議(根據咖啡機和原料給出拿鐵製作步驟)等能力。此外,儘管後訓練的視覺原語資料不包含任何中文語料,模型仍能用中文進行思考和回答,這來自基礎模型繼承的多語言能力。如圖在使用點作為視覺原語的任務上,模型能對迷宮生成逐步DFS探索軌跡,並對路徑追蹤任務生成完整的坐標序列追蹤過程。侷限性論文也列出了三個當前的侷限:第一,受輸入解析度限制,模型在極細粒度場景下的視覺原語輸出精度有時不夠高。論文認為可以通過和現有解決感知鴻溝的方法結合來彌補。第二,當前的視覺原語思維能力依賴顯式的觸發詞才能啟動,未來目標是讓模型根據具體情境自主判斷是否呼叫這一機制。第三,用點作為視覺原語來解決複雜拓撲推理問題仍然困難,模型的跨場景泛化能力有限,這是重要的未來研究方向。訓練框架使用的是High-flyer的HAI-LLM(https://www.high-flyer.cn/en/blog/hai-llm),一個基於PyTorch的輕量級分佈式訓練框架。預訓練階段使用64K序列長度和FP8精度,後訓練階段序列長度擴展到256K,在Unified RFT和OPD階段使用FP4(MXFP4)量化。 (AI寒武紀)