#商湯科技
商湯發佈多模態“效率怪獸”,開源即SOTA!最小僅8B,比肩商用
實測:15秒出高密度資訊圖,還能圖文一步到位。當GPT images 2.0又再一次搶佔頭條,人們對多模態模型的關注也在悄然變化:“畫得好”已經不再是問題了,我們還想要“速度快、效率高、成本低”。過去很長一段時間裡,視覺理解與圖像生成,往往被拆分為兩套體系:前者負責“看懂”,後者負責“畫出”,中間通過不同模組進行銜接。這種在底層邏輯上的割裂,是阻礙模型效率的核心。商湯這次的思路,是從架構層面直接處理這個問題。他們剛剛開源了原生理解生成統一模型SenseNova U1,便基於自研的NEO-unify架構,將圖像與文字的理解與生成能力統一到同一體系中,沒有了“中間商”之後,效率得到大幅提升。在圖像理解與生成的多項基準測試中,SenseNova U1 Lite在同量級開源模型中達到SOTA水平,並在多項指標上逼近商業閉源模型表現。以8B參數規模,實現接近更大模型的能力,得到“以小搏大”的表現。▲高密度資訊圖(en)▲高密度資訊圖(zh)目前,使用者可以在Hugging Face、GitHub獲取開源模型。同時,商湯AI辦公智能體“辦公小浣熊3.0”也即將接入SenseNova U1,使用者可直接體驗相關能力。01. 不堆參數,靠效率取勝:8B模型拿下開源SOTA本次開源包含兩個版本:SenseNova-U1-8B-MoT與SenseNova-U1-A3B-MoT,均基於統一的多模態理解、推理與生成架構,面向圖文理解、生成及複雜互動任務。如果從測評結果來看,SenseNova U1最突出的優勢,在於整體效率——在理解、生成、推理與圖文交錯多個維度上,用更小的模型規模,跑出了接近甚至逼近商業閉源模型的表現。在理解側,SenseNova-U1-8B-MoT在AI2D、IFBench等基準上均取得領先表現,例如在AI2D上達到91.7分。結合空間理解相關測試,可以看到模型在複雜結構與關係判斷等任務中表現穩定,具備一定的邏輯推理能力。在生成側,模型在GenEval、OneIG、LongTextBench等任務中表現穩定,能夠同時兼顧複雜結構生成與文字一致性。尤其是在資訊圖生成(Infographics)任務中,平均得分達到50.7,是開源模型最強,媲美部分閉源商業模型。進一步看編輯與圖文交錯能力,在Editing、Visual Reasoning等任務中,SenseNova U1在WISE、VBVR、OpenING、GEdit-Bench等測試中表現突出。例如在OpenING相關任務中達到91分,在視覺推理任務中也明顯優於傳統圖像生成模型。但相比這些分項成績,更關鍵的是它的“性能—效率比”。從對比結果來看,在資訊圖生成與長文字等任務中,SenseNova U1在約15秒延遲下即可取得接近60分的平均成績,整體屬於“高性能、低延遲”。對比Qwen-Image 2.0 Pro、Seedream 4.5等模型,其在生成質量接近商業閉源模型的同時,響應速度更快。▲Generation Latency vs. Averaging Performance on Infographic Benchmarks, i.e., BizGenEval (Easy, Hard), and IGenBench▲Generation Latency vs. Averaging Performance on OneIG (EN, ZH), LongText (EN, ZH), BizGenEval (Easy, Hard), CVTG and IGenBench這些性能表現背後,主要還是來自底層架構的優勢。SenseNova U1基於商湯自研的NEO-unify原生統一架構,在設計上減少了中間環節帶來的資訊損耗,因此在資料利用效率和推理開銷上更有優勢。最終呈現出來的,才得以是“以小搏大”的優勢:僅用8B參數規模,在多個維度達到同量級開源模型SOTA,並在部分任務上逼近商業閉源模型。從測評結果來看,這種優勢已經比較清晰。至於落到真實使用場景中,SenseNova U1是否同樣穩定、好用,我們來實測一番。02. 一手實測揭秘:從立體排版到“言出法隨”智東西選取了多個不同類型的任務進行測試,覆蓋高密度資訊圖、趣味創意圖以及技術流程圖等典型場景。創作資訊圖可以說是最能“精準擊中”職場人的能力。使用者只需要輸入文章、資料或文字說明,模型就能將其中的關鍵資訊提煉出來,並生成一張具備結構、層級和視覺重點的資訊圖。在“蘇超出圈之路”這一案例中,模型就生成了一張多層蛋糕式資訊圖。不同階段以立體分層形式呈現,文字隨著結構自然分佈在不同空間層級中,而不是簡單平鋪。這背後其實反映的是模型對結構的理解能力。更關鍵的是,在這種複雜排版下,整張圖沒有出現明顯的文字錯位、遮擋或渲染錯誤,整體可讀性很高。換一個更複雜的文字場景來看,模型對富文字結構的理解能力,體現得更明顯:那些資訊需要突出,那些適合做流程,那些更適合用圖表表達,那些需要用圖示輔助理解。“龍蝦使用指南”這個案例,就更能體現細節處理能力。這一任務中包含大量中英文混排、不同字號文字以及情緒化表達。模型不僅把“禁止模糊指令”“禁止無限重試”這些核心文案寫對了,還自動匹配了對應的圖示和帶情緒的畫面,比如龍蝦被“壓榨”、被“投喂指令”等。不同模組之間的文字大小、間距和佈局都處理得較為合理,沒有擠在一起,已經達到直接商用的水準了。在人物與指令理解方面,“馬斯克vs奧特曼”這一案例更具代表性。在提示詞中僅輸入“奧特曼”這一暱稱,模型直接生成了一個穿西裝的“奧特曼形象”,與旁邊的馬斯克形成對比,既符合語義又帶有明顯的趣味性。與此同時,馬斯克的表情、動作以及整個對峙氛圍也都比較到位,可見模型在人物理解和場景建構上具備較強的語義對齊能力。到了技術表達這一步,難度其實更高。在“SenseNova U1技術解讀”這一案例中,模型需要生成的是一張邏輯清晰的技術流程圖。從結果來看,整體結構層級清晰,資訊分區明確、表達直觀,對於非技術讀者也較為友好。一輪實測下來,另一個比較直觀的感受是速度。這類圖像的生成基本都在十幾秒內完成,有點接近“言出法隨”的感覺。在這樣的生成效率下,各種應用場景也不在話下。目前,SenseNova U1可生成資訊圖譜、專業簡歷、生活指南、產品說明、百科知識、漫畫創作等多種內容。對行銷、辦公、設計、商業分析等場景來說,這類能力直接對應的是內容生產效率提升。03. 告別“縫合”,NEO-unify架構如何成為理解與生成的“通才”?測評整合績有優勢,實測效果也毫不遜色,這個原生框架究竟好在那裡,我們來拆解一下。過去,多模態模型的工作方式更像是“分工協作”:視覺編碼器負責理解圖像,變分自編碼器負責生成圖像。前者看圖,後者畫圖,中間再通過不同模組完成銜接。理解與生成更像兩條平行的流程,能配合,但很難真正融合,所以SenseNova U1這次選擇直接推倒重建,從底層架構上直接改掉這套“拼接式”體系。其採用的自研NEO-unify架構,不再把語言和視覺當作需要中間轉換的兩種訊號,而是從一開始就把它們當作同一類資訊來建模。換句話說,語言與視覺不再各走各路,在同一套表徵體系裡共同參與理解、推理和生成。這種設計本質上回到了“多模態AI第一性原理”:不同模態之間本來就是內在關聯的。在具體實現上,模型儘量減少中間壓縮與轉換環節,直接從接近原始的像素和文字資訊中學習,讓資訊在傳遞過程中損耗更小。同時,它的資料和推理效率也更高。這也是SenseNova U1值得關注的地方:並不是單純靠堆參數規模換效果,而是在底層架構上重新處理多模態模型的協作方式。04. 當AI學會“帶圖思考”展開空間智能更多想像不同於GPT-image2單純圖像上的“卷王體質”,SenseNova U1也展示了另一種可能:讓圖像成為邏輯的一部分,並在推理過程中引入對空間結構的理解。這也是其“連續性圖文創作輸出”的能力核心。SenseNova U1是業內首個能夠在單一模型上進行連貫圖文交錯生成的模型。這意味著,在處理複雜任務時,模型可以一邊解釋邏輯,一邊生成對應的示意圖、流程圖、草圖或設計圖。例如在教學、在繪本故事等場景中,它可以讓文字敘事、插圖風格、人物事件等保持一致性與連貫。同時,SenseNova U1並不是先生成一段完整文字,再去“補圖”,而是從材料準備或構圖草稿開始,一步步輸出關鍵操作,並同步生成對應畫面。整個生成過程是連續的:步驟之間有承接關係,圖像之間保持風格一致,文字和視覺內容也始終圍繞同一上下文展開。這種連貫性,在過去依賴多模型串聯的方案中很難穩定實現,往往會出現風格漂移或資訊斷裂。本質上,這得益於SenseNova U1所具備的原生圖文理解生成能力,能天然將圖像和文字底層融合訊號完整的保留上下文中,在統一表徵空間進行高效連貫思考。這也讓它和空間智能產生了更直接的聯絡。空間智能關注的是模型如何理解位置、方向、佈局、關係和結構,而這些能力恰恰會在圖像生成、高密度資訊圖排版、流程圖建構和場景示意中反覆出現。如果繼續往後看,這類能力也可能成為具身智能的重要基礎。機器人要在真實環境中完成任務,不僅要“看見”物體,還要理解物體之間的關係、判斷行動路徑,並根據任務目標做出連續決策。從這個角度看,SenseNova U1的意義不只是生成更好看的圖,而是在單一模型中嘗試打通理解、推理和視覺表達。它距離真正成為機器人的“具身大腦”還有距離,但這類統一架構,至少提供了一條更接近多模態閉環的技術路徑。05. 結語:理解與生成走向統一多模態模型進入分岔口從底層架構的NEO-unify創新,到應用層面的原生圖文交錯與高密度資訊圖生成,商湯的全面開源,不僅是參數規模上的“以小搏大”,更是對多模態第一性原理的深度回歸。當行業還在討論生圖模型的真實邊界時,SenseNova U1已經通過理解與生成的統一,為AGI的到來鋪就了一條更具效率的路徑。開放原始碼的力量將讓這種原生多模態能力迅速滲透進每一個垂直行業,我們正在見證的是一個“圖文同構、思畫合一”的全新時代的開啟。在大模型全球競賽的下半場,國產模型正在輸出屬於自己的硬核解法。 (智東西)
商湯閃崩8%!國泰君安證實有人被帶走,被涉及內幕交易的到底是那家公司
3月12日消息,3月10日,據彭博援引知情人士報導,香港有關當局突擊搜查了中信證券香港子公司以及國泰君安國際香港辦公室。據悉,香港當局突擊搜查了兩家公司負責股票資本市場(ECM)業務的部門,並帶走至少一名高級主管協助調查。由於ECM主要負責股權融資,比如新股發行、配股、供股、可轉債等股權融資業務。彼時金石雜談分析,本次突擊檢查兩家中資券商或和當前的港股新股發行亂像有關。而隨著資訊進一步求證,該事件並不涉及新股發行,而是配股引發的內幕交易。3月12日早間,國泰君安國際發佈公告,證實了相關事件。港證監和廉政公署到訪公司香港主要營業地點執行搜查令,並帶走部分檔案,公司一名非董事會成員的僱員被廉署拘留。到了中午,廉政公署和港證監官宣,3月10日及11日展開聯合行動,代號是“熔斷(Fuse)”,主要是打擊內幕交易及貪污行為,搜尋了14處地點,逮捕了6男2女,年齡介乎35歲至60歲之間,被捕人員包括兩家持牌證券公司及一家持牌避險基金管理公司的高階管理人員,以及一名中間人。(金石ps:再度證實,除了國泰君安國際還有中信證券香港子公司或中信里昂)根據公告,持牌證券公司的高級行政人員涉嫌接受持牌避險基金超過400萬元的賄賂,以獲取香港上市公司進行股份配售前的內幕消息,而避險基金則在資本市場賣空相關股票或訂立空頭頭存。隨著配股消息落地,相應股價下跌,避險基金通過做空獲利3.15億港元。另據香港知情人士對金石雜談表示,該案所涉避險基金是Infini Capital Management Ltd.,陳倩雯也被捲入了這場清剿行動中。這是一家專注於泛亞市場的另類投資機構,托尼·陳(Tony Chin,錢濤)是Infini Capital的創始人,曾任職於摩根士丹利和匯豐銀行,2011年起開始在中國內地開展交易,2015年進軍離岸市場,23年迎來了外部資金。托尼還是多家科技傳媒與電信(TMT)初創企業的大股東和董事會成員,這些企業後來成長為行業領軍者。其實,大家最為關心的還是,中信證券或國泰君安到底參與配股了那家公司,而被避險基金Infini Capital提前做空,實現非法獲利。金石雜談統計wind資料發現,近1年時間,由中信證券和國泰君安都參與的上市公司配售有商湯、佑駕創新、晶泰控股、一脈陽光、優必選,其中,兩家券商都參與的上市公司中,優必選和一脈陽光都是兩次。國泰君安和招銀國際還在9月參與商湯的配售。(以下是中信和國泰君安都參與承銷的配股公司)這6隻股票中,近60日跌幅較大的只有一脈陽光,跌幅高達52%;而年初至今,佑駕創新跌17%,優必選跌15%。此外,2025年以來,無極資本以獨家認購方式參與了多家港股上市公司的H股配售,投資對象包括黑芝麻智能、範式智能、微盟集團、協鑫科技、商湯、中國儒意等。對此,有香港分析師對金石雜談表示,無極資本應該通過做空某隻股票,然後通過配股的方式參與回購。(以下圖片來源活報告)在這其中,商湯和微盟的主承銷商是中信里昂和國泰君安,受此消息影響,商湯科技今日暴跌8%,2月23日以來已暴跌23.8%,微盟則跌幅有限。這是否商湯科技就是那隻被內幕交易的股票?金石雜談查詢發現,商湯7月配股之前,商湯股價長期在低位徘徊,配股以後,股價漲幅近乎翻倍,本次配股消息發出前下跌的不夠明顯,仍有待求證。但是,12月18日,商湯再度配股,在配股前1個月半月股價暴跌35%以上,但是本次承配人具體名單並未公佈。不少於6名承配人,17.5億股,對應市值33.08億港元。佑駕創新、晶泰控股、一脈陽光、優必選等股票走勢又如何呢?其中,1)佑駕創新11月25日配股前股價是跌了,但配股後也是一路下行,如果無極資本參與,是很難賺到錢的(6名配股人名單未公佈)。2)晶泰控股在8月29日配股之前股價一直在漲,配股後也是一直在漲,同樣不符合。3)一脈陽光同樣不符合,這種股價跌跌不休、沒有盈利空間的股票,相信無極資本是不會參與認購的。4)優必選7月22日這波不符合,前期一直在陰跌調整;而11月25日這波則恰到好處,在配股前一個半月跌幅超30%,同樣做空利潤豐厚。6名承配人共計認購3146.8萬股,對應當時市值34.8億。5)微盟集團9月18日配股前股價還在拉升中,配股後沒多久就經歷了暴跌,無極資本若參與是很難賺到錢的。6)國泰君安保薦的範式智能在7月17日配股前股價拉升,配股後也拉升,也不符合做空套利的情況。7)中信證券保薦的中國儒意,同時有無極資本參與,是否符合呢?8月1日配股,前期漲幅驚人,配股後一直陰跌,同樣不符合前期做空賺錢,後期認購賺錢的情況。綜上所述,金石雜談分析發現,商湯科技和優必選都存在因Infini Capital 通過內幕交易做空而實現違規盈利的可能,而無論商湯(12月配股)還是優必選(11月配股),都無法敲定是否有無極資本的參與。我們一起讓子彈飛一會,靜待市場開盲盒。 (金石雜談)
中國AI雙雄的港股競速
1月8日,智譜以120港元的開盤價在港交所上市,市值為528.28億港元。智譜的發行價為每股116.20港元,對應募資總額約43.48億港元,其公開發售部分獲得約1164倍超額認購。而就在明天,MiniMax也將在港交所主機板掛牌。MiniMax發行價格為每股151至165港元,對應募集資金總額38.34億至41.89億,公開發售部分超額認購倍數更是高達1209倍。相隔僅一日,智譜AI與MiniMax接連登陸港交所,以截然不同的基因與路徑,爭奪“中國大模型第一股”之名,也對應出中國AI創業的分化與抉擇。“原生家庭”的差異2002年,張鵬從清華大學電腦系本科畢業,選擇了留校繼續攻讀研究生,也因此,他遇到了同年入系攻讀博士的唐傑。2006年,為了填補國內科技情報分析平台的缺失,張鵬和唐傑依託清華大學知識工程實驗室(KEG),牽頭孵化出了AMiner系統。2018年,AMiner的商業化處理程序加速。同年,以中科院西安光機所背景和擅長科技成果轉化投資而聞名的投資機構——中科創星,將自然語言處理、知識圖譜作為其重點關注的投資方向,第一時間聯絡上了張鵬團隊,提供了公司籌備方面的幫助。2019年6月,AMiner獨立拆分,在清華教授與KEG實驗室支援下成立了新公司智譜AI。中科創星成為了智譜AI第一家外部股東。MiniMax的故事,要從2015年閆俊傑從中科院自動化所博士畢業之後說起。博士期間,閆俊傑曾是百度AI研究院的實習生,參與早期神經網路最佳化項目,接觸並預見了AI從專用任務走向通用模型的技術演進路徑。博士畢業後,閆俊傑加入商湯科技,從演算法實習生起步,因主導深度學習工具鏈建設,及通用智能技術體系搭建,三年內晉陞至副總裁,管理規模達700餘人的核心研發團隊。在其負責期間,商湯麵部識別演算法拿到了行業第一的市場份額。2021年底,商湯衝刺IPO之際,閆俊傑選擇離職創業。促使他離開的,並非職位或待遇,而是對技術路徑的判斷分歧。閆俊傑認為,只做特定任務的AI(如人臉識別、語音識別)已觸及商業化天花板,而通用人工智慧(AGI)才是服務普通人、創造規模化價值的終極方向。2021年春天,閆俊傑與雲啟資本團隊在上海黃浦江畔首次會面。彼時,“大模型”尚未成為行業熱詞,但閆俊傑已明確:若foundation model成立,AI將無需定製,即可服務海量使用者,形成標準化產品。這一判斷獲得雲啟資本的認可,雲啟成為了MiniMax的第一家股東。2022年1月,MiniMax在上海正式成立。張鵬在清華積累的學術基因,與中科創星來自中科院體系的科研基因,使得智譜有了一個“根正苗紅”的學術與科研起點。而閆俊傑博士畢業後投身科技公司,積累一線實戰開發經歷,加上雲啟資本的美元背景,讓MiniMax持有一本“雙幣護照”。也因此,兩家公司對“技術—資本—市場”的理解有差異:智譜是“合規—國資—ToG”帶來的溢價,MiniMax則是“流量—美元—ToC”帶來的機會。兩家公司創始人的起點,決定了公司未來不同的成長之路。“成長補給”的不同起點影響的,是公司能借到的“外力”不同。2019年成立至2025年,智譜AI累計完成8輪融資,累計融資規模83億元人民幣,IPO前估值244億人民幣。進入成長期後,智譜AI的股東團裡除了達晨財智、華控基金、紅杉中國、高瓴創投、順為資本、光合創投、啟明創投、君聯資本等頭部財務VC外,還出現了另外兩類資本的堅定下注。一方面,是美團、阿里巴巴、螞蟻集團、騰訊、學而思、BOSS直聘等產業資本戰略入股,形成“投資+場景”的繫結關係。另一方面,則是被圈內戲稱為地方國資“通訊錄”的國資股東版圖:北京人工智慧產業投資基金、珠海華發集團、杭州城投、中關村科學城、金浦投資、順禧基金、中國信科等國資背景基金批次入場。在本次IPO發行中,智譜引入了更加多元化的基石投資陣容,涵蓋北京國資、頭部保險資金、大型公募基金、明星私募基金、產業投資方等,包括清華大學教育基金、北京金控、泰康人壽、廣發基金、上海高毅、3W Fund、霧淞資本、凌雲光等投資方。基石投資者認購比例高達68.6%。相較而言,MiniMax的投資者中,國資比重就少了很多,取而代之的,是C端流量的戰略協同和國際化資本加碼。MiniMax招股書披露,公司累計完成7輪融資,共計融資15.56億美元(約110.61億人民幣),2025年8月最後一輪融資(Pre-B++輪)投後估值42.404億美元(約302億元人民幣)。閆俊傑的投資人清單中,包括阿里巴巴、米哈游、騰訊、小紅書、金山辦公等產業投資方,持股比例較高,合計持股比例超25%。此外,雲啟資本、明勢創投、IDG資本、高瓴創投、經緯創投、紅杉中國等知名雙幣創投機構,也是從早期便伴隨其成長。值得一提的是,MiniMax的基石投資者更加多元,既有阿里巴巴的持續深度繫結,還有ADIA(阿布扎比投資局)、英國保誠集團旗下Eastspring Investments、韓國未來資產等國際頂級資本的大力加持,匯添富香港、易方達基金等頂級公募基金也紛紛加入,博裕資本、IDG資本、Aspex、泰康人壽等跟進。融資結構的差異,是兩家公司原生基因的對應。智譜以人民幣國資作為壓艙石,換取了ToB/ToG訂單的確定性,也背負了重資產重交付的包袱;MiniMax憑藉全球化資本背書,加強了其在海外市場搏殺的優勢,但不得不直面地緣政治與流量成本的風險。合規vs流量的較量基因寫入的是國資還是美元,已決定了公司的技術路線與業務形態。智譜和MiniMax所選擇的技術路線和商業發展路徑,越來越凸顯各自獨特的風格。智譜的技術核心是,稠密大模型(Dense Model)的國產化全端改造。從GLM-130B到GLM-4系列,智譜採用“全參數啟動”架構,訓練依賴國產神威超算與華為昇騰晶片,混合精度算子也已完成對國產異構計算框架的適配。其技術護城河在工程化適配能力:將模型壓縮、指令微調、演算法封裝成“可信大模型交付包”。招股書顯示,智譜AI的主要收入模式為向客戶提供本地化部署和雲端部署服務。2025年上半年,本地化部署的收入佔總營收的84.8%,中國地區又佔整體本地化部署收入的88.4%。截至2025年12月,智譜系列模型已為超12000家機構客戶、超8000萬台裝置提供支援,客戶包括政府、大型央企,以及三星、小鵬等企業。2023年至2025年,智譜來自政府及大型央企的收入佔比,一直維持在60%左右,前五大客戶貢獻超總營收的40%。客戶採購第一原則,不一定是極致的模型能力,更看重的是,“安全、合規、可控”。這成為智譜擺在桌面上的非技術護城河。然而,本地部署為主的模式,造成了極重的交付成本。有媒體報導稱,智譜的每一單央企或政府客戶,均需6至9個月駐場部署。不過,這也讓智譜收穫了較高的毛利。2025年上半年,智譜本地部署業務的毛利為59.1%,雖不及過去傳統軟體企業70%的毛利水平,但也比自己同賽道競爭者,高出不少。MiniMax自創立起,便押注混合專家(MoE)架構,其M2模型以10B啟動參數承載230B總參數量,通過動態路由與模型量化技術,將單次推理成本壓至Claude 4.5的8%。這一輕量化設計,使星野/Talkie等產品,能在主流GPU叢集高效運行,上線一年內,推理成本下降60%。這家公司的技術護城河,建立在蒸餾與量化效率之上。MoE架構更適用於大規模的C端服務,MiniMax的打法,也更偏向網際網路,核心收入模式為C端訂閱和API收費。MiniMax招股書顯示,公司主要收入來源於Agent應用MiniMax、視覺生成平台海螺AI、虛擬陪伴平台Talkie/星野等AI原生產品,佔比71%。Talkie通過Gacha抽卡機制,將AI技術封裝為娛樂消費品,上線18個月即在美國、日本、巴西等六個國家獲得應用程式商店總榜前十。單使用者日均使用時長75分鐘,超過TikTok的55分鐘,ARPU達3.2美元。2025年1-9月,MiniMax原生產品使用者量2.12億,MAU約2762萬,付費使用者數約177萬。與之對應的,2025年上半年,其AI原生產品業務的毛利僅為4.7%。困擾MiniMax的風險因素主要有兩個:一是,地緣政治的不確定性,易觸發監管出手,產品面臨突然整改及下架風險;另一個是,投流成本雖在被攤薄,仍然高企。招股書顯示,其銷售成本佔收入比,2023年、2024年分別是的124.7%、87.8%,2025年1-9月為76.7%。其AI原生產品業務的低毛利,也正是這個原因。寫在最後六年時間的演進,智譜與MiniMax成長為了兩個物種。智譜用技術重資產和合規可控,換取了政策紅利和大B/G端的確定性訂單,MiniMax則用架構輕量化,換取了C端的使用者增長和全球化擴張速度。技術路線與商業模式的差異,本質上是創始人基因、資本血統與市場環境共同作用下的理性選擇。在IPO之後,智譜與MiniMax面臨的考驗,是商業閉環與造血能力。二者的路徑或許永不相交,但平行存在,本身是中國AI產業走向多元與深水的標誌。 (鈦媒體)
商湯科技連虧七年,押注生成式AI,拐點何時來?
曾頭頂“AI第一股”赴港上市的商湯科技,距離盈利還有多遠?3月26日港股收盤後,商湯科技(00020.HK)發佈2024年度業績,全年實現營收37.72億元,同比增長10.8%;淨虧損43.06億元,同比縮小33.7%;經調整EBITDA(息稅折舊及攤銷前利潤)虧損縮小42.3%至31.43億元。這是自2018年以來,商湯科技連續虧損的第七個年頭,累計虧損超過500億元。商湯科技以人臉識別應用起家,在公司初創之際,憑藉卓越的人臉識別演算法,成功獲得明星資本青睞。2021年底,正值AI視覺產業的高光期,商湯科技成功登陸港交所,創下當時國內AI企業最大規模IPO。近年來,商湯科技的營收結構發生了數次調整,過往營收主要來源於智慧商業和智慧城市,兩大業務合計佔比超過八成。不過,2023年,商湯科技開始把業務重心轉向生成式AI,業務重組調整為生成式AI、傳統AI和智能汽車三個類股。2024年底,商湯科技再度將業務重組為生成式AI、智能汽車及視覺AI。多次調整之後,生成式AI已成為商湯科技的核心敘事。2024年,生成式AI的收入同比增長103.1%至24.04億元,佔營收的比重從2023年的34.8%大幅提升至2024年的63.7%,成為了第一大收入來源。相比之下,商湯科技起家的視覺AI業務在2024年實現收入11.12億元,同比大幅下降39.5%,營收佔比則從2023年的53.9%降至29.5%;智能汽車收入亦下降33.2%至2.56億元,營收佔比亦從11.3%降至6.8%。然而,市場對於商湯科技的這劑AI猛藥,仍表現觀望姿態。3月27日,商湯科技的股價遭遇跳空下跌,跌幅一度逼近9%,此後出現回升,但截至收盤跌幅仍超6%,最新市值約551億港元。蔡淑敏 攝從傳統AI到生成式AI生成式AI,不出意外地成為了商湯科技最新財報中多次出現的關鍵詞。商湯科技的生成式AI相關業務,包括提供算力的“大裝置”、AI基礎模型和應用。商湯科技在財報中強調,目前生成式AI已經成為集團的最大收入貢獻來源,也是公司歷史上最快突破20億元營收規模的類股。商湯成立於2014年,由香港中文大學多媒體實驗室走出的AI科學家湯曉鷗教授與徐立博士共同創辦,最早是通過電腦視覺技術(CV)進入AI行業。2021年登陸資本市場時,商湯科技是中國最大的電腦視覺軟體公司,當時的業務主要分為智慧商業、智慧城市、智慧汽車和智慧生活四大類股。其中,在智能商業領域,商湯專注於企業端市場,如商場、商業園區及各類製造企業,為它們提供營運最佳化、安全保障及質量控制等方面的AI解決方案;智慧城市業務則主要滿足各級政府在交通管理、環境保護、應急響應等領域的AI技術需求。2021年,智慧城市與智能商業兩大業務領域合計營收佔比已接近九成,成為商湯科技的核心收入來源。然而,2022年,隨著這兩大類股的客戶在人工智慧方面的開支大幅縮減,項目建設和部署也相應推遲,導致商湯科技這兩大業務遭受重創。這一年商湯科技智慧城市業務營收為10.96億元,同比下降48.8%,在集團總收入中的佔比從2021年的45.6%下滑至28.8%。智能商業業務營收為14.64億元,同比下降25.2%,收入佔比也從41.7%減少至38.4%。更為重要的是,繼2021年淨利潤虧損超過170億元後,2022年,商湯科技繼續告虧60.45億元。2018年至2024年商湯科技淨利潤趨勢圖(資料來源:wind  馬雲飛 制)2022年末,OpenAI推出的ChatGPT引發行業浪潮,讓正在尋找業績新引擎的商湯科技看到了希望。2023年,商湯科技果斷調整戰略方向,將業務重心轉移至生成式AI領域。與此同時,公司也重新規劃了業務類股,確立了生成式AI、傳統AI以及智能汽車三大業務類股。生成式AI即提供生成式AI的模型訓練、微調及推理服務業務,傳統AI即過去四大類股中的三個的綜合——智慧城市、智慧商業與智慧生活等AI業務,而原來四大類股之一的智能汽車類股保持不變。其中,生成式AI業務位列類股之首。2023年,商湯科技生成式AI收入增至11.84億元,佔比34.8%,較2022年的3.95億元同比增長199.9%。2024年,其生成式AI業務收入24.04億元,同比提升增長103.1%,營收佔比超過六成。商湯科技解釋稱,生成式AI業務的快速增長,主要來源於市場對生成式AI模型訓練、微調和推理的需求爆發性增長,“我們亦繼續將我們的生成式AI相關應用產品商業化,包括在網際網路、智能硬體、機器人、醫療和金融等領域”。降本難解盈利焦慮不過,對於AI公司而言,如何實現大模型的商業化仍然是一個嚴峻的考驗,商湯科技也不例外。2024年是商湯科技成立的第十個年頭。去年10月,商湯科技董事長兼CEO徐立發佈商湯10周年的內部信,稱AI 1.0時代模型生產的主要成本在於研發人員的投入,而在AI 2.0時代,模型生產的成本主要在於算力資源的投入。在組織層面,圍繞戰略和核心資源,商湯科技將建構更加集中和高效的組織架構,推動資源的集中和集約化投入。此後,商湯科技陷入裁員風波,不過彼時官方的回應比較模棱兩可,僅稱“公司在積極推進戰略轉型,聚焦‘大裝置-大模型-應用’重點業務和戰略增長領域,並進行相應的組織和人才結構最佳化和調整。”隨後,2024年12月初,商湯科技宣佈將公司業務架構變為“1+X”:“1”即生成式AI相關業務,包括提供算力的“大裝置”、AI基礎模型和應用;“X”則是智能汽車“絕影”、家庭機器人“元蘿蔔”、智慧醫療、智慧零售等,這些業務將拆分並獨立融資。元蘿蔔機器人 (蔡淑敏 攝)在最新的年報中,商湯科技官方稱,隨著集團不斷深化資源聚焦與效率最佳化的戰略,除了持續投入研發以外,管理與銷售總費用同比下降9.1%。得益於以上舉措,集團在2024年的淨虧損為43.06億元,同比縮窄33.7%。2024年,商湯科技的研發支出從2023年的34.66億元增長19.2%至2024年的41.32億元。官方稱,這主要由於其增加了對訓練和微調基礎模型的投資,以及生成式AI應用開發所產生的折舊和攤銷費用,還有伺服器營運和雲服務費用的增加所致。相比之下,銷售開支與行政均在下降。其中,銷售開支由2023年8.18億元下降20%至2024年的6.55億元,行政開支由2023年的15.1億元減少3.1%至14.64億元。商湯科技稱,主要由於員工福利開支、行銷及差旅開支減少。值得注意的是,截至2024年12月31日,商湯科技的總僱員為3756名,與2023年同期減少了約17%。現金流方面,截至2024年底,總現金儲備為127.5億元,其中包括88.88億元和定期存款29.7億元。全年經營活動所用現金淨額為39.27億元,較2023年擴大,主要因生成式AI業務對算力資源需求增加。除了持續虧損的問題,商湯科技的應收帳款的帳齡仍在持續惡化。截至2024年12月31日,商湯應收帳款為69.74億元,相比2023年同期減少了近10億元,但帳齡惡化,超3年的應收帳款從2023年的15.42億元增長到38.21億元。“我們大部分歷史收入來自智慧城市業務,在付款批核程序的限制下,付款周期長。”商湯科技解釋稱,儘管自2023年以來,商湯整體現金收回情況相對健康,但帳齡相對較長的應收款項的收回情況仍然面臨挑戰,原因為部分客戶——尤其是來自或面向公營機構的客戶面臨暫時的預算限制。 (國際金融報)