#商湯
中國AI雙雄的港股競速
1月8日,智譜以120港元的開盤價在港交所上市,市值為528.28億港元。智譜的發行價為每股116.20港元,對應募資總額約43.48億港元,其公開發售部分獲得約1164倍超額認購。而就在明天,MiniMax也將在港交所主機板掛牌。MiniMax發行價格為每股151至165港元,對應募集資金總額38.34億至41.89億,公開發售部分超額認購倍數更是高達1209倍。相隔僅一日,智譜AI與MiniMax接連登陸港交所,以截然不同的基因與路徑,爭奪“中國大模型第一股”之名,也對應出中國AI創業的分化與抉擇。“原生家庭”的差異2002年,張鵬從清華大學電腦系本科畢業,選擇了留校繼續攻讀研究生,也因此,他遇到了同年入系攻讀博士的唐傑。2006年,為了填補國內科技情報分析平台的缺失,張鵬和唐傑依託清華大學知識工程實驗室(KEG),牽頭孵化出了AMiner系統。2018年,AMiner的商業化處理程序加速。同年,以中科院西安光機所背景和擅長科技成果轉化投資而聞名的投資機構——中科創星,將自然語言處理、知識圖譜作為其重點關注的投資方向,第一時間聯絡上了張鵬團隊,提供了公司籌備方面的幫助。2019年6月,AMiner獨立拆分,在清華教授與KEG實驗室支援下成立了新公司智譜AI。中科創星成為了智譜AI第一家外部股東。MiniMax的故事,要從2015年閆俊傑從中科院自動化所博士畢業之後說起。博士期間,閆俊傑曾是百度AI研究院的實習生,參與早期神經網路最佳化項目,接觸並預見了AI從專用任務走向通用模型的技術演進路徑。博士畢業後,閆俊傑加入商湯科技,從演算法實習生起步,因主導深度學習工具鏈建設,及通用智能技術體系搭建,三年內晉陞至副總裁,管理規模達700餘人的核心研發團隊。在其負責期間,商湯麵部識別演算法拿到了行業第一的市場份額。2021年底,商湯衝刺IPO之際,閆俊傑選擇離職創業。促使他離開的,並非職位或待遇,而是對技術路徑的判斷分歧。閆俊傑認為,只做特定任務的AI(如人臉識別、語音識別)已觸及商業化天花板,而通用人工智慧(AGI)才是服務普通人、創造規模化價值的終極方向。2021年春天,閆俊傑與雲啟資本團隊在上海黃浦江畔首次會面。彼時,“大模型”尚未成為行業熱詞,但閆俊傑已明確:若foundation model成立,AI將無需定製,即可服務海量使用者,形成標準化產品。這一判斷獲得雲啟資本的認可,雲啟成為了MiniMax的第一家股東。2022年1月,MiniMax在上海正式成立。張鵬在清華積累的學術基因,與中科創星來自中科院體系的科研基因,使得智譜有了一個“根正苗紅”的學術與科研起點。而閆俊傑博士畢業後投身科技公司,積累一線實戰開發經歷,加上雲啟資本的美元背景,讓MiniMax持有一本“雙幣護照”。也因此,兩家公司對“技術—資本—市場”的理解有差異:智譜是“合規—國資—ToG”帶來的溢價,MiniMax則是“流量—美元—ToC”帶來的機會。兩家公司創始人的起點,決定了公司未來不同的成長之路。“成長補給”的不同起點影響的,是公司能借到的“外力”不同。2019年成立至2025年,智譜AI累計完成8輪融資,累計融資規模83億元人民幣,IPO前估值244億人民幣。進入成長期後,智譜AI的股東團裡除了達晨財智、華控基金、紅杉中國、高瓴創投、順為資本、光合創投、啟明創投、君聯資本等頭部財務VC外,還出現了另外兩類資本的堅定下注。一方面,是美團、阿里巴巴、螞蟻集團、騰訊、學而思、BOSS直聘等產業資本戰略入股,形成“投資+場景”的繫結關係。另一方面,則是被圈內戲稱為地方國資“通訊錄”的國資股東版圖:北京人工智慧產業投資基金、珠海華發集團、杭州城投、中關村科學城、金浦投資、順禧基金、中國信科等國資背景基金批次入場。在本次IPO發行中,智譜引入了更加多元化的基石投資陣容,涵蓋北京國資、頭部保險資金、大型公募基金、明星私募基金、產業投資方等,包括清華大學教育基金、北京金控、泰康人壽、廣發基金、上海高毅、3W Fund、霧淞資本、凌雲光等投資方。基石投資者認購比例高達68.6%。相較而言,MiniMax的投資者中,國資比重就少了很多,取而代之的,是C端流量的戰略協同和國際化資本加碼。MiniMax招股書披露,公司累計完成7輪融資,共計融資15.56億美元(約110.61億人民幣),2025年8月最後一輪融資(Pre-B++輪)投後估值42.404億美元(約302億元人民幣)。閆俊傑的投資人清單中,包括阿里巴巴、米哈游、騰訊、小紅書、金山辦公等產業投資方,持股比例較高,合計持股比例超25%。此外,雲啟資本、明勢創投、IDG資本、高瓴創投、經緯創投、紅杉中國等知名雙幣創投機構,也是從早期便伴隨其成長。值得一提的是,MiniMax的基石投資者更加多元,既有阿里巴巴的持續深度繫結,還有ADIA(阿布扎比投資局)、英國保誠集團旗下Eastspring Investments、韓國未來資產等國際頂級資本的大力加持,匯添富香港、易方達基金等頂級公募基金也紛紛加入,博裕資本、IDG資本、Aspex、泰康人壽等跟進。融資結構的差異,是兩家公司原生基因的對應。智譜以人民幣國資作為壓艙石,換取了ToB/ToG訂單的確定性,也背負了重資產重交付的包袱;MiniMax憑藉全球化資本背書,加強了其在海外市場搏殺的優勢,但不得不直面地緣政治與流量成本的風險。合規vs流量的較量基因寫入的是國資還是美元,已決定了公司的技術路線與業務形態。智譜和MiniMax所選擇的技術路線和商業發展路徑,越來越凸顯各自獨特的風格。智譜的技術核心是,稠密大模型(Dense Model)的國產化全端改造。從GLM-130B到GLM-4系列,智譜採用“全參數啟動”架構,訓練依賴國產神威超算與華為昇騰晶片,混合精度算子也已完成對國產異構計算框架的適配。其技術護城河在工程化適配能力:將模型壓縮、指令微調、演算法封裝成“可信大模型交付包”。招股書顯示,智譜AI的主要收入模式為向客戶提供本地化部署和雲端部署服務。2025年上半年,本地化部署的收入佔總營收的84.8%,中國地區又佔整體本地化部署收入的88.4%。截至2025年12月,智譜系列模型已為超12000家機構客戶、超8000萬台裝置提供支援,客戶包括政府、大型央企,以及三星、小鵬等企業。2023年至2025年,智譜來自政府及大型央企的收入佔比,一直維持在60%左右,前五大客戶貢獻超總營收的40%。客戶採購第一原則,不一定是極致的模型能力,更看重的是,“安全、合規、可控”。這成為智譜擺在桌面上的非技術護城河。然而,本地部署為主的模式,造成了極重的交付成本。有媒體報導稱,智譜的每一單央企或政府客戶,均需6至9個月駐場部署。不過,這也讓智譜收穫了較高的毛利。2025年上半年,智譜本地部署業務的毛利為59.1%,雖不及過去傳統軟體企業70%的毛利水平,但也比自己同賽道競爭者,高出不少。MiniMax自創立起,便押注混合專家(MoE)架構,其M2模型以10B啟動參數承載230B總參數量,通過動態路由與模型量化技術,將單次推理成本壓至Claude 4.5的8%。這一輕量化設計,使星野/Talkie等產品,能在主流GPU叢集高效運行,上線一年內,推理成本下降60%。這家公司的技術護城河,建立在蒸餾與量化效率之上。MoE架構更適用於大規模的C端服務,MiniMax的打法,也更偏向網際網路,核心收入模式為C端訂閱和API收費。MiniMax招股書顯示,公司主要收入來源於Agent應用MiniMax、視覺生成平台海螺AI、虛擬陪伴平台Talkie/星野等AI原生產品,佔比71%。Talkie通過Gacha抽卡機制,將AI技術封裝為娛樂消費品,上線18個月即在美國、日本、巴西等六個國家獲得應用程式商店總榜前十。單使用者日均使用時長75分鐘,超過TikTok的55分鐘,ARPU達3.2美元。2025年1-9月,MiniMax原生產品使用者量2.12億,MAU約2762萬,付費使用者數約177萬。與之對應的,2025年上半年,其AI原生產品業務的毛利僅為4.7%。困擾MiniMax的風險因素主要有兩個:一是,地緣政治的不確定性,易觸發監管出手,產品面臨突然整改及下架風險;另一個是,投流成本雖在被攤薄,仍然高企。招股書顯示,其銷售成本佔收入比,2023年、2024年分別是的124.7%、87.8%,2025年1-9月為76.7%。其AI原生產品業務的低毛利,也正是這個原因。寫在最後六年時間的演進,智譜與MiniMax成長為了兩個物種。智譜用技術重資產和合規可控,換取了政策紅利和大B/G端的確定性訂單,MiniMax則用架構輕量化,換取了C端的使用者增長和全球化擴張速度。技術路線與商業模式的差異,本質上是創始人基因、資本血統與市場環境共同作用下的理性選擇。在IPO之後,智譜與MiniMax面臨的考驗,是商業閉環與造血能力。二者的路徑或許永不相交,但平行存在,本身是中國AI產業走向多元與深水的標誌。 (鈦媒體)
摩爾線程IPO背後:與商湯多年合作,印證AI產業“軟硬協同”趨勢
摩爾線程的火爆上市,是中國AI產業鏈協同突圍的里程碑。其背後,商湯科技以創新的“算力Mall”模式,正為國產晶片鋪就一條從“可用”到“好用”的關鍵路徑。12月5日,國產GPU企業摩爾線程成功上市,開盤大漲超過400%,市值突破2700億元。這無疑是中國AI晶片產業的一個高光時刻。而在資本市場的熱度之外,更應冷靜審視其背後的產業邏輯:國產GPU的真正瓶頸,已不是單純的算力比拚,而是生態的不完善。輝達的核心競爭力,在於其構築多年的CUDA軟體生態壁壘。如何破局?摩爾線程與商湯科技的長期合作提供了一個樣本:唯有深度生態協同,才能實現“軟硬一體”的國產化突圍。合作多年,商湯演算法+摩爾算力高效協同商湯官方在回覆投資者問題時表示,“公司與摩爾線程多年來保持業務合作關係,公司演算法已完成對其相關產品的適配,雙方的協同將有助於提升公司產品的市場適配性。”據悉,雙方在大模型訓練推理技術最佳化、軟體生態支撐、核心技術攻關等領域已經形成高效協同。一方面,摩爾線程的優勢在於全功能GPU,兼顧AI計算與圖形渲染,其豐富的演算法需求與日益提升的算力供應形成強有力的合作基礎。另一方面,商湯對算力的需求是多元的,大模型訓練需要極致的浮點運算能力,AIGC視訊生成等應用又需要強大的渲染能力。摩爾線程圖形渲染領域具備差異化能力,滿足商湯在大模型運算與不同場景的復合算力需求,並反哺商湯演算法落地效率提升。由此,雙方形成“需求-供給-最佳化”的閉環合作機制,市場競爭力也獲得同步提升。搭建國產算力極佳試驗場對摩爾線程而言,商湯領先的日日新大模型體系、商湯AI大裝置SenseCore及其廣泛的落地場景,構成了絕佳的規模化場景驗證平台,能為其提供關鍵的產品驗證和背書,有助於拓展行業客戶。目前,摩爾線程的MTT S系列GPU已經完成與商湯大裝置SenseCore的全面適配,實現了對商湯日日新多模態大模型體系的支援。這意味著,國產GPU首次在千億參數級的大模型訓練與推理任務中,接受了工業級標準的嚴苛考驗。在真實的業務壓力下,商湯不僅幫助摩爾線程驗證性能、打磨產品,完成產品從“可用”到“好用”的淬煉;同時商湯借助晶片企業的管道資源觸達更多潛在客戶,形成“生態擴容 - 客戶增長 - 業績提升”的良性循環,也強化了自身“生態主導者”的估值溢價。生態共建:“商湯算力Mall”推動中國AI算力自主可控在全球高端AI算力供應受限的大背景下,建立多元、穩定的國產算力供應鏈以及生態協同至關重要。“商湯大裝置算力Mall”聯動多家晶片企業打造國產AI算力生態聯盟,建構了全場景算力解決方案,降低企業獲取高性能算力門檻,快速擴大客戶覆蓋範圍,提升市場滲透率,助力AI技術快速滲透至各行業場景。以摩爾線程為例,其今年7月作為核心成員加入“商湯大裝置算力Mall”,平台下游的數字孿生、具身智能等企業,可以借助商湯的平台,使用經過適配驗證的摩爾線程晶片算力,商湯串聯產業鏈上下游,算力的提供方和適用方,都能夠借助商湯的生態影響力加快拓展市場。業內普遍認為,商湯與多家國產AI晶片企業深度合作,共同攻克“卡脖子”技術,實現算力自主可控,推動了中國AI算力的自主可控與產業發展,形成“技術互補、資源共享、場景互哺”的合作生態,也減少市場對供應鏈短缺的擔憂。 (21世紀經濟報導)
開源模型竟在空間智能領域超越GPT-5?商湯日日新打破AI三維認知瓶頸
開源模型竟在空間智能領域超越GPT-5?商湯日日新打破AI三維認知瓶頸一項評測資料顯示,商湯開放原始碼的8B參數模型在空間理解任務中以60.99分碾壓GPT-5的49.68分,這場看似不可能的反超,揭示了AI從“語言天才”邁向“物理世界通才”的關鍵轉折。一、空間智能:AI融入現實世界的最後一道壁壘當前大模型在知識推理、程式碼生成等領域已接近人類水平,卻在看似簡單的空間問題上頻頻“翻車”。例如,GPT-5能破解《最強大腦》級圖形推理題,卻敗給兒童等級的立方體俯檢視選擇題,錯誤選擇選項A(正確答案為B)。這種“二維智能”與“三維現實”的割裂,成為自動駕駛、機器人等具身智能落地的核心瓶頸。圖片來源:商湯科技 人類兒童可輕易解決的空間問題,卻難倒頂級大模型(來源:商湯評測案例)二、技術破局:Scale Law在空間認知領域的首次驗證商湯SenseNova-SI的突破性表現,源於對空間智能的系統性重構:1. 六大能力維度覆蓋首次建立覆蓋空間測量、重構、關係、視角轉換、形變與推理的完整能力體系,避免單一能力短板。1. 資料尺度效應實證通過高品質資料規模化訓練,使8B模型在VSI/MMSI/MindCube/ViewSpatial四大基準平均分達60.99,較同規格開源模型(如Qwen3-VL-8B的40.16分)領先超50%。1. 通用增強範式訓練方法適配InternVL等主流架構,實現基模型空間能力的“無損升級”。圖片來源:商湯科技 四大權威基準評測結果(來源:商湯GitHub)三、性能碾壓:開源模型為何能反超閉源巨頭?在關鍵場景測試中,SenseNova-SI-8B展現出壓倒性優勢:• 俯檢視推理:GPT-5誤選D,商湯模型正確選B(SITE-Bench題庫)• 相對方位判斷:GPT-5錯誤判斷摩托車在左側,商湯正確識別右側• 動態場景預測:在多車道場景中,GPT-5錯誤預測車輛靜止,商湯精準判斷右轉動作圖片來源:商湯科技 空間推理任務對比:GPT-5(左)vs SenseNova-SI(右)更值得關注的是,該模型以僅8B參數量實現對GPT-5(49.68分)和Gemini 2.5 Pro(48.81分)的超越,證明性能突破並非依賴參數堆砌,而是技術範式的本質創新。四、生態衝擊:開源戰略重構AI競爭格局商湯此次同步開源測評平台EASI與“英雄榜”,意圖明顯:1. 標準定義權爭奪通過建立空間智能評估基準,引導行業技術發展方向。1. 開發者生態建構降低企業應用門檻,加速技術在下游場景滲透。1. 反哺閉源業務開源模型為商湯“悟能”具身智能平台提供技術驗證與人才引流。圖片來源:商湯科技 空間智能測評平台EASI架構(來源:GitHub)五、商業化前景:給AI裝上“空間GPS”空間智能的技術突破,將直接推動三大場景落地加速:1. 自動駕駛車輛對複雜路況的時空關係理解能力提升,減少Corner Case事故。1. 工業機器人機械臂在非結構化環境中的物體抓取、避障精度顯著提高。1. AR/VR應用虛擬物體與物理空間的即時精準疊加,提升沉浸式體驗。圖片來源:宸境科技 空間智能技術在自動駕駛、城市管理等場景的應用(來源:行業方案)六、未來挑戰:開源模型能否持續領跑?儘管SenseNova-SI取得突破,但仍需面對:• 資料壁壘:閉源廠商可能通過私有場景資料重建優勢• 算力門檻:大規模空間資料訓練仍需高昂成本• 泛化能力:當前評測集中於靜態任務,動態互動能力待驗證結語:AI三維認知的時代拐點商湯此次開源不僅是一次技術展示,更標誌著AI從“感知二維訊號”邁向“理解三維世界”的範式轉換。當開源模型在核心能力上比肩甚至超越閉源巨頭,整個行業的技術擴散速度與創新節奏將被重新定義。對於技術決策者而言,現在正是佈局空間智能應用場景的關鍵窗口期——因為能“看懂”世界的AI,終將重塑所有與物理空間互動的行業。 (Mr.velar)
不止於Sora 2!商湯Seko再次定義“成片智能體”,AI視頻生成迎來殺手級應用
讓AI視頻生成拿來即用。AI影片的競爭焦點開始轉移——不再侷限於單一畫面效果的比拚,而是聚焦可用性與開箱即用的突破。9月底Sora 2的橫空出世便清晰傳遞出這一趨勢:其不僅以精彩紛呈的動態生成效果刷新行業認知,更通過能引入現實角色、提升物理模擬逼真度、整合創編傳播工具等的綜合性“成片智能體”,展現了向易用性、實用性發展的趨勢。這一行業趨勢逐漸明晰的當下,國產平台商湯Seko早已率先佈局,以實際行動重新定義AI視頻的應用邊界。下面的影片就直觀展示了Seko的成片能力,這一視頻從劇本、故事板、配音到後期均由Seko完成,並且精細到每一個細節都符合導演和編劇要求,畫面以及動畫效果也都拉到專業級。Seko用戶@聽白AIGC 生成了下面的視頻,將動漫形象與現實環境相結合且毫無違和感,使得整體畫面質感提升。還有下面的恐怖氛圍短片,Seko使用者@liuker、@不會畫畫的美術生生成的視頻中呈現了醫院場景,從陰森的空間佈局到冷冽的燈光風格,所有視覺元素全程線上、精準配合,成功營造出壓抑、驚悚的恐怖氛圍。作為國內首個創編一體的短片創作Agent平台,Seko使用者規模與作品數量的快速爆發增長證明了產品的價值。從工具到智能體、從畫面到成片,AI正從根本上降低內容生產的門檻、提升創作效率、拓展表達邊界。在這場由Sora2引領的變革中,國產平台商湯Seko是亦步亦趨的追隨者,還是另闢蹊徑的破局者?我們試圖拆解Sora 2與Seko,找到其在這場變革中搶佔先機的關鍵要素。01. 「成片智能體」風起:從技術炫技到應用為王回溯AI視頻產業的發展脈絡,早期產品多停留在技術驗證層面,往往會通過生成各類逼真、新奇的視頻內容來滿足用戶好奇心,如今隨著營銷、短劇、自媒體等領域的剛性需求爆發,其定位正逐漸向生產力工具轉移,而能否覆蓋從創意到成片的全流程,也成為衡量產品價值的核心標準。9月底爆火的Sora 2以及OpenAI伴隨其發布的Sora應用就清晰表明了這一趨勢。具體來看,在核心生成能力上,Sora 2實現了全維度的效能提升。物理模擬層面,其優化動力學與材質還原的可信度,能精準呈現對象體積、遮擋關係與光照互動,例如模擬液體潑灑時的流動軌跡、織物飄動的重力反饋均更貼近真實物理邏輯;音頻能力實現了音畫一體化生成,環境音、動作音效可隨性的畫面自動匹配;提示詞:吉卜力工作室動畫風格,畫面中一個男孩和他的狗跑上長滿青草的風景優美的山坡,頭頂是絕美的雲朵,遠處背景中還能眺望到一個村莊(in the style of a studio ghibli anime, a boy and his dog run up arassy scenic mount y接著是產品形態方面,OpenAI伴隨Sora 2推出的獨立Sora App社交平台,透過內置的Cameo(角色引入)功能,用戶可建立高度逼真的個人數字分身,無縫植入任意Sora 2的生成場景,還能授權好友使用自己的形象實現多人同框創作。相較於上一代產品,Sora 2正向著更符合使用者實際創作需求的工具轉型。但值得注意的是,Sora 2的生成本質上仍是「黑盒式」輸出,因為用戶輸入指令後需等待系統完整輸出,無法對中間環節進行干預調整,即便使用千字級的詳細提示詞,也可能出現與預期偏差的生成結果。因此在實際應用場景,這對追求精準表達的商業創作而言,無疑意味著不可預測的時間損耗與修改成本。反觀國內,商湯科技今年8月推出的Seko就在成片智能體的基礎上,實現了「可控式閉環」。Seko可以做到自動劇本拆解、故事板產生、角色一致性控制等,來產生高品質AI視頻,與Sora 2在成片智能體核心能力上實現對標。下面Seko使用者@豆芽AI筆記本產生的視頻中主體角色整體一致,畫面跟隨人物移動時也沒有出現偏差。與Sora 2不同的是,Seko支援即時可編輯,非一次輸入、一次輸出,甚至可對分鏡畫佈局部修改,消除、重繪、元素加入等,讓使用者透過精細化編輯實現「所見即所得」。▲Seko故事板畫佈局部修改功能儘管當下AI視頻發展距離規模化應用還有一定距離,但當下我們可以確定的是,其行業競爭正在從單一效果比拚轉向全鏈路價值競爭,也就是“成片智能體”在AI視頻工具中逐漸成為共識。02. 解碼「成片智能體」概念讓AI視頻開箱即用的關鍵以「成片智能體」應具備的能力為標準,我們看到Sora 2和Seko的部分能力設定高度趨同,都朝著讓AI視頻生成開箱即用視頻、零門檻出成片的目標進階。需要注意的是,即便二者在降低創作難度、覆蓋全流程需求等方向上高度趨同,但實現路徑呈現鮮明差異,Sora 2強調的是端到端直接輸出,Seko則看重生成過程中各環節進行可控性編輯。先來具體看下兩大平台的相似與不同之處。首先,降低使用門檻的前提是,讓AI能聽懂使用者的日常表達,減少對專業工具的依賴。Sora 2和Seko都可以理解使用者的日常用語,不需要更專業的術語即可產生相應的視頻內容,打破AI視頻創作對專業知識的依賴。在實測體驗時,當智東西輸入「小羊介紹新疆伊犁的美麗景色,一隻擬人化的小羊羔,超寫實風格」的提示詞,其就會生成策劃摘要、美術風格、角色主體、場景概念、音樂風格、故事板劇本。另外眾所周知影片的創作需要不同的工具進行音畫比配、實體模擬等,Seko將復雜技術環節全部封裝為後台自動流程,使用者無需手動調試參數,更無需借助剪輯、配音等第三方工具,就可以實現輸入想法就能得到​​視頻的體驗。Seko近日上線的新功能還支援一鍵製作多人對口型視頻,基於SekoTalk這個商湯自研的圖生視頻對口型演算法,在音樂MV、劇情視頻、廣告等領域都可以應用。在下面的影片中,它支援中英文等多種語言、多人對口型,包括輪流說話或同時說話的情況,即使是語速超快的說唱也不會出現偏差。其次是端到端直接輸出與極致的可編輯性,這也是Sora 2和Seko兩大成片智能體最核心的區別。Sora 2和Seko都可以覆蓋創作的全鏈路,其支援多模態輸入,使用者能透過文字描述建構場景、上傳參考圖定義角色外觀,可一次完成從創意拆解、理解複雜指令到成片輸出的端到端貫通。值得一提的是,這次Sora應用程式新增的Cameo與Seko的主體功能類似,都是透過產生統一的角色,保證後續生成內容的主體穩定、一致。▲Sora 2的Cameo功能(左)、Seko的主體功能(右)在此之上,Seko還進一步將生成內容進行了細化拆解,打造了「先靜後動」流程,將創作分為分鏡確認、細節修改、視頻生成幾個階段,具體來說就是,平台先根據用戶創意生成靜態分鏡序列,經用戶逐幀檢查畫面內容後,可以直接通過自然語言指令重繪角色、調整台詞或鏡頭角度,最後都可以確認鏡頭,最後都可以確認視頻。為了進一步確保成片的可控性,Seko還具備故事板靜態預覽、分鏡畫佈局部修改等功能,允許使用者在每個環節,對生成內容進行修改,如直接要求“把圖中的小羊換成牧羊犬”,系統能精準完成修改。Seko也支援一鍵修改背景,如要求「更換背景為咖啡廳」等。▲Seko局部修改功能當使用者確認了故事板的主體、影片內容、文字內容,就可以在右上方點選一鍵轉視頻。相較於Sora 2的一鍵成片,Seko的成片方式給了使用者更大的自由創作空間。最後是成片品質方面,相較於早期的工具,Sora 2、Seko在視頻生成內容的鏡頭穿幫、音畫不同步等問題上,已經基本實現了超長分鏡的穩定輸出。在此基礎上,Seko平台還更進一步,整合了商湯日日新、即夢、可靈、海螺、Veo等多款業界主流生圖模型,使用者基於該平台能精準控制多角色、多場景的複雜劇本輸出,確保角色形象、光線風格、動作邏輯全程穩定。在下面Seko使用者@不會畫畫的美術生生成的影片中,Seko將背景音樂、鏡頭轉換等諸多設定都與劇本內容相呼應。這些技術突破共同指向,AI視頻生成正朝著「成片智能體」進化,其核心是透過極簡互動、全流程貫通與高品質輸出降低創作門檻。商湯科技的Seko在此基礎上基於故事板預覽、可控式流程等關鍵能力,在視頻生成的可控性與商業可行性兩大關鍵維度上率先落地,讓「成片智能體」真正從技術概念變為觸手可及的生產力工具。03. 從不可控到可落地:Seko重構AI視頻商業化價值邏輯Sora 2和Seko的發展讓我們看到了AI視頻商業化落地的潛力,但當我們將視野放大到整個生成式AI行業會發現,想要讓AI視頻生成真正實現拿來即用,遠比圖文生成複雜得多。影片創作需同步處理畫面渲染的時序邏輯、音訊合成的情緒適配、物理模擬的真實回饋等多重難題,任何環節的斷層都會讓產生的影片出現偏差。正因為這種複雜性,Sora 2與商湯Seko在「成片智能體」的定位上,也呈現出了差異化的思路,前者聚焦從輸入到輸出的高品質端到端交付,後者則在保證成片質量的基礎上,強化了全流程創作的自主、可編輯與可控性。在下面Seko使用者@林龍生成的影片中,伴隨著鏡頭的變化將拯救公主的故事進行了完整呈現,還融入了逼真的特效。如同前面所提到的,創作可控性在AI視頻生成中至關重要,這也是Seko相比Sora 2等其他工具的顯著優勢,其核心可概括為創意可控、風格可控、成本可控。創意可控基本貫穿了前期使用者創作的全流程。使用者輸入核心創意後可進入編輯模式,對畫面細節不滿意可直接修改提示詞重繪單幀分鏡,覺得台詞生硬能逐句調整文案並同步更新配音,想優化敘事節奏可直接增減分鏡或調整鏡頭結構。這種先確認靜態效果、再產生動態視訊的設計,可以幫助使用者在早期修正創意偏差。其次是風格可控,Sora 2的模型體系相對單一,Seko採用了多模型整合和智慧匹配策略,整合了全行業主流生成模型,支援使用者自主選擇相應模型。最後是成本,Sora 2雖能產生高品質畫面,但其千卡級算力消耗帶來的隱性成本,讓中小型商家和個人創作者難以負擔。根據實際使用者回饋,Seko已將單分鐘動畫成本從傳統方式的數萬元降至千元等級,降幅超99.5%以上,讓中小企業和個人創作者也能負擔專業級製作。另外還要注意的是,Sora 2目前仍採用邀請制,並沒有免費向大眾開放,導致大量潛在使用者無法直觀體驗。再加上用戶紛紛在社群平台上傳Sora 2產生的短影片,涉及諸多熱門影視節目角色,使得其在版權方面的監管被廣泛質疑。目前,Seko已經全面向用戶開放,其上線1個月就擁有超10萬名創作者,生成視頻內容超50萬條。這些真實的使用者案例和資料,是Seko開箱即用潛力最有力的證明,其讓AI視頻創作變為可預期、可調整、可落地的過程,這也成為其區別於同類產品的核心競爭力。04. 結語:AI視頻競爭回歸實用價值Seko憑可控+普惠領跑當下AI視頻產業的發展意味著,其競爭正在回歸到價值本身,即能否以更低門檻、更可控過程和更低成本為使用者交付可用成果。Sora 2與商湯Seko共同指向的“成片智能體”,正是破解視頻生成普及難題的關鍵。商湯Seko透過創作可控性和商業普惠性,正在將這一藍圖變為觸手可及的商業現實。這條本土超越之路,或許正是AI影片普及的關鍵路徑。此外,Seko還有一大獨特優勢是集合多種大模型,未來或許也會接入Sora 2模型的能力,為使用者提供1+1>2的更優成片效果。 (智東西)
港股下挫,商湯跌超4%,阿里、百度跌超3%,長風藥業大漲180%
10月8日,港股開盤大幅回呼。截至午盤收盤,三大指數跌超1%,其中恆生科技指數一度跌超2%。阿里、百度、商湯等大跌人工智慧相關個股集體下跌。商湯跌超4%,阿里、百度跌超3%,金山軟體、京東跌超2%。據券商中國報導分析人士認為,美股昨晚全線殺跌,晶片等人工智慧相關股票跌幅居前,費城半導體指數跌超2%,甲骨文股價一度暴跌超7%,這可能是港股大幅回呼的主因。核電類股,黃金股走強港股核電類股走強,中核國際漲逾18%,中廣核礦業漲逾9%,上海電氣漲逾4%。黃金股大漲,赤峰黃金漲超14%。截至發稿,現貨黃金站上4020美元整數關口,日內漲0.9%,再創歷史新高。部分投資機構對金價的後續走勢仍然保持高度樂觀。高盛將2026年12月金價預估上調至4900美元/盎司,先前預估為4300美元。預計2025年和2026年各國央行的黃金淨購買量將分別平均為80噸和70噸,因為新興市場央行可能會繼續通過增持黃金來實現外匯儲備的結構性多元化。瑞銀近期發佈報告稱,黃金市場目前傾向於看漲行情,預計到2026年年中金價將升至4200美元/盎司。瑞銀認為,美元走弱、央行大舉購買黃金以及ETF投資增加等因素對金價構成利多,同時建議黃金在投資組合中的配置比例為5%左右。新股長風藥業(02652.HK)上市首日大幅高開逾218%。截至發稿,上漲近超180%。實際上,10月6日,長風藥業暗盤漲近97%,總市值近120億港元。長風藥業主要專注於吸入技術及吸入藥物的研發、生產及商業化,專注於治療呼吸系統疾病。公司已開發出覆蓋廣泛患者、醫學專科及治療領域的產品組合。財務狀況方面,於2022年、2023年、2024年及截至2024年前3個月及2025年3月31日止三個月,公司的收益分別為人民幣3.49億元、人民幣5.56億元、人民幣6.08億元、人民幣1.4億元及人民幣1.36億元,公司的毛利分別為人民幣2.67億元、人民幣4.58億元、人民幣4.91億元、人民幣1.15億元及人民幣1.08億元。儘管今日港股市場有所調整,但未來走勢仍被機構看好。前海開源基金首席經濟學家、基金經理楊德龍認為,港股受到更多外資流入的推動。國慶期間,南下資金暫停,但港股仍保持強勢,這說明不少外資在加速配置港股資產,無論是港股低估值資產還是科技網際網路類股,都成為資金配置的重點。“我們預計這輪A股和港股的牛市行情有望長期持續。現在A股和港股‘金九銀十’的行情成色越來越足,預計‘十一’之後,A股和港股仍會延續強勢上攻態勢,市場賺錢效應依然較高。建議投資者保持信心與耐心,抓住中國資產估值大幅回升的機會,努力實現財富增長,把握這輪牛市機遇。” (21世紀經濟報導)
商湯:市值突破千億,高盛目標價跳漲50%,券商集體唱好
9月17日,香港特區行政長官李家超發表《行政長官2025年施政報告》。李家超表示,特區政府將成立AI效能提升組,推進“AI+”發展,促進AI政務發展。同日,商湯-W(00020.HK)股價飆升,總市值突破千億港元大關,創下近期新高。商湯本輪上漲受多重因素推動。此前,高盛也在最新報告中把商湯評級從“中性”一舉上調至“買入”,目標價上調幅度接近五成。能讓市場用腳投票,並能讓高盛這家以謹慎著稱的國際大行“中翻多”,商湯到底做對了什麼?答案就藏在剛剛公佈的2025年中期業績裡。01. 高盛報告:營收與生成式AI業務“雙超預期”商湯2025年中期業績堪稱優秀“三連擊”:營收增長、虧損縮小、現金儲備改善。高盛報告用一句話總結:營收與生成式AI業務“雙超預期”。具體來看,商湯上半年錄得收入24億元,同比增長36%,超出前期高盛和彭博共識給出的市場預期;其中生成式AI收入同比激增73%,連續三次大幅度提升,佔集團總收入比重提升至77%,印證了公司戰略重心轉移的成功。上半年,毛利率維持在39%,經調整淨虧損同比縮小50%,經營現金流淨流出同比縮小八成以上,帳上現金儲備高達132億元。貿易應收管理成傚尤為突出——回款金額同比大增96%至32億元,應收帳款周轉天數縮短49%。高盛在報告中強調:“這種回款效率創歷史新高,反映銷售交付閉環能力質的飛躍。”現金流淨流出同比縮小82%,驗證了商湯向“精細營運”的戰略轉型。生成式AI業務的高歌猛進,得益於“一基兩翼”的業務發展策略,使其產品矩陣快速滲透到各行各業,逐步向AI賦能千行百業創業初衷踐行。面向企業服務的“小浣熊”系列已擁有超過300萬使用者,金融、教育、政務三大垂直版本在短短數月完成規模化落地,成為B端生產力工具的標竿。日日新多模態大模型V6.5支援文字、圖像、視訊多模態流式互動,互動時長年內增長超五倍,已賦能銀河通用、傅利葉等具身智能企業,並在AI文旅、消費級AI應用及硬體、AI教育等場景實現商業化落地。至此,商湯完成了從“模型”到“應用”再到“場景”的商業閉環,生成式AI不再只是技術概念,而是可量化、可復購、可擴張的商業化來源。傳統視覺AI業務則提供了穩健現金流與高品質客戶池。上半年,視覺AI服務客戶超過660家,復購率達57%,在中國電腦視覺市場份額連續九年排名第一,汽車座艙視覺AI軟體市佔率連續五年第一。更值得注意的是,海外商機儲備與新訂單同比顯著增長,盈利能力和現金流同步改善,為集團貢獻了穩定的“現金牛”。X創新業務則讓資本市場看到“獨立於集團,接受市場化的紅利”。其中,X創新業務以智慧醫療“善萃”、智慧零售“善惠”等完成對外融資引入盈峰控股、金沙江創投等知名機構入局為例,其估值方法由母公司合併報表轉向獨立市值,資本效率將被重新定價。若其中任何一家率先啟動IPO遞表,將直接觸發“分拆溢價”重估模型。參考 2023 年美團-W 對 KeeTa 的分拆行情,母公司在消息落地前後跑出大幅的超額收益,商湯當前市值對應的分拆期權價值尚未計入。02. AI賦能百業:從AI基礎設施、大模型到資料飛輪,層層加固護城河如果說亮眼的財務資料是“果”,那麼全端技術能力與場景落地能力就是“因”。商湯從AI基礎設施、大模型到資料飛輪,層層加固護城河。AI基礎設施端,商湯大裝置營運總算力已突破2.5萬PetaFLOPS,國產晶片異構叢集規模達5000卡,叢集利用率達到80%,異構訓練效率達到95%,上海臨港AIDC二期按計畫持續擴容。需要強調的是,引入國產晶片異構叢集,能減少對外部晶片廠商的依賴,從而避免了全球供應鏈風險的影響,強化了在AI領域的自主可控能力。另外,通過動態負載平衡與演算法協同,商湯大模型能壓縮推理成本,為規模化交付奠定成本優勢,也為自身的生成式AI、大模型和行業應用提供強大的支援,保證業務的高效擴展和靈活應對市場需求的能力。模型端,日日新V6.5受益於模型架構的改進,在實現成本最佳化的同時,預訓練吞吐量提升了20%以上,強化學習效率提升了40%,推理吞吐量提升了35%以上。多模態推理與互動性能大幅提升,成本降至原始的30%,同時帶來5倍性能的提升,性價比提升3倍以上。日日新V6.5在OpenCompass和SuperCLUE評測中斬獲雙冠軍,在國內首批通過中國信通院“大模型通用能力成熟度4+級”測評,長思維鏈與多模態融合技術比肩GPT-4o。 華泰證券在報告中指出,V6.5的推理性能與訓練效率雙雙刷新行業紀錄,成為商湯撬動B端與C端市場的“技術支點”。資料飛輪則把成本曲線進一步拉低。智能Agent自主挖掘資料,不僅大幅降低了資料準備成本,還加速了模型的最佳化過程。海通國際在報告中強調:“自動化飛輪使商湯擺脫資料標註依賴,建構了競爭對手難以複製的資料壁壘。”值得一提的是,商湯的全端技術能力絕非單點突破,有望發揮“國產算力×多模態認知×資料飛輪”的乘積效應。03. 券商集體看好,商湯已打開了一條清晰的估值上升通道在資本市場的視角下,商湯的這份財報贏得了多家國際與本土券商的“集體看多”,釋放出強烈的積極訊號。高盛的翻多邏輯建立在“政策+需求+產品力”的共振之上。從政策層面看,國務院在《關於深入實施“人工智慧+”行動的意見》中提出,到2027年重點行業AI Agent滲透率要達到70%,到2030年則進一步提升至90%。這一頂層設計不僅為商湯這樣的頭部AI企業提供了明確的發展方向,也為其在行業內的加速滲透創造了制度性紅利。從需求角度來看,高盛調研顯示,企業客戶在AI資本性支出(CapEx)上的預算將在2025年同比增長超過40%,而私有雲大模型的訂單甚至已經排到了2026年。這意味著,商湯所主打的生成式AI解決方案正處在需求快速釋放的窗口期。而在產品力方面,商湯已經通過SenseCore 2.0(算力平台)、SenseNova 6.5(大模型)以及覆蓋多行業的應用矩陣,形成了“交鑰匙”式的全端解決方案。這種高度一體化的技術與應用結合,提升了客戶的粘性和切換成本,為其市場份額的穩固與提升打下堅實基礎。從估值的角度,高盛基於DCF與EV/Sales的綜合模型,將商湯目標價設定為2.72港元,隱含著約30%的上行空間,而這一幅度遠高於大中華科技股平均僅9%的水平。這顯示出資本市場對商湯稀缺性和成長性的高度認可。更重要的是,高盛預計商湯的生成式AI收入佔比將在2030年達到91%,幾乎構成核心業務的全部。若這一預測實現,商湯將在未來十年間真正完成由技術驅動向產業主導的躍遷。不僅是高盛,國內外多家券商也對商湯表達了相似的樂觀態度。中泰證券在首次覆蓋商湯時,直接給出“增持”評級,理由是其大模型已穩居第一梯隊,並且通過業務拆分與融資最佳化現金流,從而具備了更強的資本運作能力。華泰證券則維持“買入”評級,特別強調了日日新V6系列在多模態性能上的領先優勢,認為這將成為商湯擴大差異化競爭的重要抓手。海通國際的分析則指出,生成式AI不僅推動了商湯營收的高速增長,更帶來了經營效率的改善,其估值在同類標的中具備性價比。國金證券等機構同樣強調,商湯在“算力+模型+應用”的組合上具備行業稀缺性,這種底層基礎設施的領先地位難以複製,也將持續推動其市佔率的提升。可以看到,券商們的共識集中在兩點:一是商湯的稀缺性。無論是SenseCore這樣的算力平台,還是日日新大模型,都構成了行業少有的全鏈條基礎能力,使得商湯能夠在生成式AI時代脫穎而出。二是商湯的市佔率提升邏輯。憑藉強大的研發實力和場景落地能力,商湯在多個核心賽道保持第一,並不斷拓展海外市場,進一步鞏固了龍頭地位。至此,中外券商形成罕見共識:商湯已打開了一條清晰的估值上升通道。當“稀缺底座”遇上“市佔率及政策加速”,商湯的投資價值,才剛剛開始被市場真正定價。當積極因素在同一坐標系裡共振,估值的時鐘便會被重設。商湯用一份“營收超預期、虧損快縮小、現金大回流”的中報,把“何時盈利”的疑問改寫為“盈利多大”的想像。更重要的是,在全球AI產業鏈重構的背景下,商湯不僅是中國AI龍頭企業的代表,更是國產算力與大模型技術自主化的重要參與者,其戰略意義已經超越單一公司的商業成敗,是中國式AI佈局的核心代表性標的。資料顯示,商湯股價年初至今已累漲近80%,區間最高漲幅逾110%,成交額與換手率雙雙放大。在公佈優異的中期財報後,商湯的市場表現更是迎來了新的高峰,千億市值正式落定。有市場人士指出,AI龍頭的β行情仍處於初期,資金在加速搶籌。(格隆)
“AI掉隊者聯盟”謀求改命
現在的AI應用就像韓國偶像團體一樣新人輩出——臉還沒被認熟就推出了新的版本,然後就是噼裡啪啦一頓造勢,結果總是會有作品、實力配不上流量的感覺。而那些十年前出道的AI前輩們,則是大部分都面臨著技術路線風險、轉型困難、金主不再力捧的問題,落下了一個或者幾個梯隊。這兩類企業可以有一個共同的名字:AI掉隊者聯盟。以曾經行業頭部企業商湯為例,2021年赴港上市的時候,貴為全球估值最高的AI獨角獸企業,但從2022年開始股價就一直深度下跌。目前,其市值與最高點相比已蒸發3000億港元以上。商湯股價表現(自2022年至今)其創始團隊的退場更是令人唏噓,科研實力過硬、被稱為人臉識別技術開拓者的湯曉鷗先生在2023年猝然離世,聯合創始人徐冰也在今年端午節前官宣辭去執行董事及董事會秘書的職務,獲任AI晶片業務負責人。商湯在公告中強調,此次職務調整是公司整體人才部署與業務聚焦的一部分,某種程度上也可以理解為,AI 1.0時代的核心技術並不能用於引領2.0時代。為了成功轉型,商湯表現出了再次創業的決心。像商湯這樣努力向著2.0時代翻湧的AI前浪們還有許多。當然,這其中也包括了一些以極快速度成為了前浪的後浪們。01. 轉型整個AI 1.0時代最出圈的事件可能是2016年,AlphaGo擊敗韓國頂尖棋手李世石。不過比起AlphaGo背後的深度學習技術,同時代的中國AI創業公司押注的主要是電腦視覺技術(CV)。所謂的電腦視覺(CV)技術主要指人臉識別、圖像檢測技術,這個賽道誕生了赫赫有名的AI四小龍,即商湯、雲從、曠視和依圖。電腦視覺技術之所以成為AI 1.0時代最早實現突破的子賽道,是技術成熟度、應用場景明確性、資料與硬體支援、以及市場需求共同作用的結果。商湯、曠視等企業的創始團隊大多來自香港中文大學、清華大學等頂尖學術機構,是真的能寫出前沿學術論文的那種。科學家創業者們的集中出現,讓技術從實驗室到產業化的轉化周期大幅縮短,為企業的快速成長創造了條件。11年前,曠視科技在2014年推出的Face++人臉識別系統,當時精準率達到99.5%,遠超傳統方法。這種技術突破直接推動了安防、金融等行業的付費意願,形成了人工智慧技術落地早期的商業基礎。中國龐大的應用場景,又為電腦視覺企業提供了獨特的資料優勢。商湯通過與政府合作獲取交通監控資料,雲從則依託銀行客戶積累金融場景樣本,進一步升級自己的核心技術。AI四小龍當時的發展非常迅速,成為了資本市場中的大明星。但這一切風光都建立在兩個最重要的假設上:技術領先必然轉化為商業優勢,以及政府支援能夠持續創造需求。2020年後,這兩個假設都被推翻了。政策方面,中國人工智慧戰略在2020年後轉嚮應用落地。政策重心的轉移,使得依賴單一政策支援的商業模式難以為繼。這種國家級戰略的變化,會在很大程度上決定金主們的投資決策。簡單來說,投資人不願意再給AI四小龍提供無限子彈,讓他們繼續燒錢研發、無視虧損。後期的情況就是,市場開始拿著放大鏡檢視AI四小龍的財務狀況,並希望他們的產品能夠在各類產業中產生實際業務和現金流。以商湯為例,2024年營收37.72億元雖實現10.8%同比增長,但較2021年歷史峰值47億元仍低19.7%。2024年淨虧損42.78億元,相當於每天燒掉1172萬元,虧損額較2023年64.3億元雖縮小33.7%,但絕對值仍超過全年營收。財務壓力之下,人力資源成本最終成了AI四小龍無法避免的問題:商湯自2021年起員工總數從6113人縮減至4672人,非核心業務被裁撤;雲從去年實施全員降薪20%的舉措,今年核心技術團隊出走;依圖科技的裁員幅度更是達到了驚人的70%。在ChatGPT開啟了技術路線完全不同的AI 2.0時代後,技術轉型,尤其是向市場證明自己有能力邁入2.0時代,成了AI四小龍們最重要的任務。02. 改命與AI 1.0時代相比,2.0時代最顯著的特徵,就是大規模預訓練模型的興起。這些模型通過在海量資料上進行預訓練,掌握了通用的語言、圖像理解能力,然後可以通過微調適應各種具體任務。ChatGPT的橫空出世,標誌著人工智慧技術發生了根本性的轉變,2.0時代的人工智慧似乎才是社會進步真正需要的人工智慧。AI 1.0與AI 2.0在技術架構上存在的根本性差異,直接導致了兩者在應用場景和商業價值上的巨大分野。梁文鋒改變了中國人工智慧產業的格局以第四範式為例,這家公司十年前做機器學習平台,現在轉型Agent服務商,這種業務迭代本身就很能說明行業趨勢的變化。所謂的AI Agent指能主動感知環境、規劃目標並使用工具執行任務的智能體,做個簡單而形象的比喻,就是企業的“數字員工”。這種模式在垂直領域的商業化落地中,頗為管用。因為垂直領域通常具有明確的業務流程和標準化需求, AI Agent能夠針對這些固定場景進行深度最佳化,而且積累的行業專有資料,比如金融交易記錄、醫療影像資料等,可以輕鬆複製到這個垂類的其他企業的流程最佳化中。所以第四範式明確提出“Agent負責溝通需求,世界模型解決垂直問題”的雙核架構,讓Agent這個新業務反哺先知平台老業務。近日,第四範式發佈醫療行業AI智能體解決方案,通過“AI Agent+醫療行業模型”,為醫療機構提供從診療服務到營運管理的全方位智能升級。公司股價因此異動,6月4日漲超4%,6月9日又大漲9.79%。第四範式創始人戴文淵思必馳也是類似的模式,通過垂直領域,在一群大廠背景、搞通用大模型的競爭對手中,找到可供自己生存的縫隙。只不過相比第四範式走的“軟體路線”,思必馳走的是“硬體路線”。思必馳的硬體產品主要包括AI語音晶片、AI模組、AI終端等,廣泛應用於智能汽車、智能家居、消費電子等領域。截至2024年,思必馳的自研AI晶片年出貨量已超過2000萬顆,新增IoT類裝置達1.6億台。創業公司能取得這個成績已屬不易,但在思必馳第一次衝擊IPO時,上交所上市稽核委員會在審議過程中,還是重點質疑了思必馳的核心技術是否具備足夠的硬科技屬性,以及其在市場競爭中的差異化優勢是否有效。這個質疑,其實也適用於所有只能在垂直場景中安身立命的AI創業公司。畢竟通用大模型一旦徹底成功,那麼垂直領域的AI公司,就要面臨技術壁壘崩塌、成長天花板壓低的問題。2.0時代,資本市場留給大家證明盈利能力和經營可持續的時間,可不會太多。03. 嘗試商湯就非常清楚,作為1.0時代的“遺老”,需要向市場證明自己有進入多模態競技場的能力,才能在2.0時代繼續前行。算力成為了這一切謀劃的基礎。商湯大裝置建構了面向大模型訓練和推理的AI原生雲算力基礎設施,旗下的上海臨港AIDC 2022年1月正式落地啟用,峰值算力9400P,是亞洲最大的人工智慧算力中心之一。同時,商湯在持續迭代自己的大模型,其“日日新大模型”自2023年4月發佈1.0 版本以來,如今已更新到了第6版,並且被權威大模型測評機構SuperCLUE認可為國內大模型第一梯隊。不過看看這個榜單裡其他大廠的名字,商湯要想保持技術優勢、爭取商業優勢,難度顯然不會太低。以騰訊為例,原本在自研大模型的競爭中表現得並不突出,但因為抓住了DeepSeek開放原始碼的技術紅利,配合上自己的騰訊雲和微信,成功實現了商業化逆襲。一個佐證就是,接入DeepSeek讓騰訊原有業務的活躍使用者增長了,截至2025年3月31日,微信/WeChat月活躍帳戶數達到1,402百萬戶,較2024年12月31日的1,385百萬戶有所增長。騰訊在2024年Q4及2025年Q1的財報中多次強調,AI技術的持續投入將為公司帶來長期增長動力。困擾商湯等AI創業公司最嚴重的盈利問題,在騰訊等大廠面前,遠遠算不上生死攸關。這些大廠憑藉自己的人力財力、流量入口、商業生態,再加上AI技術開放原始碼的東風,大可以走向純AI創業公司永遠達不到的高度。這一點,AI 2.0時代的“前輩”月之暗面,恐怕也是心有慼慼。DeepSeek-R1等開源模型性能對標GPT-4,且免費開放API,直接削弱了Kimi的長文字技術壁壘。大廠整合開源模型最佳化自身產品——包括月之暗面背後的“金主”阿里,都可以用更低的成本實現高性能,導致Kimi的差異化優勢喪失。於是月之暗面也迅速迎來了市場對其投資回報率、未來盈利能力的拷問。與AI四小龍相比,月之暗面眼下的窘境在本質上也有諸多相似之處,所以月之暗面也在努力證明自己在多模態領域的進展。月之暗面創始人楊植麟近期就對媒體表示,多模態是公司當前持續的重點投入方向。在看到OpenAI發佈的GPT-4o的多模態能力後,對月之暗面而言,“可能探索一些不一樣的路徑去適配市場和使用者的一些實踐。”月之暗面創始人楊植麟所謂的多模態,是指人工智慧系統通過整合多種感知模態(如文字、圖像、音訊、視訊等)進行綜合理解與生成的技術範式。正因為涉及了多種感知模態,現在市場對誰能跑出來、以什麼樣的產品形態跑出來,還是充滿了迷茫和分歧,而且投入與產出都是很難預測出來的數字。就像沒能在1.0時代裡完成上市的曠視,一邊推動其多模態大模型與麒麟AI PC作業系統進行融合,響應國家的信創政策,一邊又與吉利合作,在高階智能駕駛上壓下重注。說到底,都是因為摸不準商業化成功的路徑,只能儘量多去嘗試。 (巨潮WAVE)
商湯科技連虧七年,押注生成式AI,拐點何時來?
曾頭頂“AI第一股”赴港上市的商湯科技,距離盈利還有多遠?3月26日港股收盤後,商湯科技(00020.HK)發佈2024年度業績,全年實現營收37.72億元,同比增長10.8%;淨虧損43.06億元,同比縮小33.7%;經調整EBITDA(息稅折舊及攤銷前利潤)虧損縮小42.3%至31.43億元。這是自2018年以來,商湯科技連續虧損的第七個年頭,累計虧損超過500億元。商湯科技以人臉識別應用起家,在公司初創之際,憑藉卓越的人臉識別演算法,成功獲得明星資本青睞。2021年底,正值AI視覺產業的高光期,商湯科技成功登陸港交所,創下當時國內AI企業最大規模IPO。近年來,商湯科技的營收結構發生了數次調整,過往營收主要來源於智慧商業和智慧城市,兩大業務合計佔比超過八成。不過,2023年,商湯科技開始把業務重心轉向生成式AI,業務重組調整為生成式AI、傳統AI和智能汽車三個類股。2024年底,商湯科技再度將業務重組為生成式AI、智能汽車及視覺AI。多次調整之後,生成式AI已成為商湯科技的核心敘事。2024年,生成式AI的收入同比增長103.1%至24.04億元,佔營收的比重從2023年的34.8%大幅提升至2024年的63.7%,成為了第一大收入來源。相比之下,商湯科技起家的視覺AI業務在2024年實現收入11.12億元,同比大幅下降39.5%,營收佔比則從2023年的53.9%降至29.5%;智能汽車收入亦下降33.2%至2.56億元,營收佔比亦從11.3%降至6.8%。然而,市場對於商湯科技的這劑AI猛藥,仍表現觀望姿態。3月27日,商湯科技的股價遭遇跳空下跌,跌幅一度逼近9%,此後出現回升,但截至收盤跌幅仍超6%,最新市值約551億港元。蔡淑敏 攝從傳統AI到生成式AI生成式AI,不出意外地成為了商湯科技最新財報中多次出現的關鍵詞。商湯科技的生成式AI相關業務,包括提供算力的“大裝置”、AI基礎模型和應用。商湯科技在財報中強調,目前生成式AI已經成為集團的最大收入貢獻來源,也是公司歷史上最快突破20億元營收規模的類股。商湯成立於2014年,由香港中文大學多媒體實驗室走出的AI科學家湯曉鷗教授與徐立博士共同創辦,最早是通過電腦視覺技術(CV)進入AI行業。2021年登陸資本市場時,商湯科技是中國最大的電腦視覺軟體公司,當時的業務主要分為智慧商業、智慧城市、智慧汽車和智慧生活四大類股。其中,在智能商業領域,商湯專注於企業端市場,如商場、商業園區及各類製造企業,為它們提供營運最佳化、安全保障及質量控制等方面的AI解決方案;智慧城市業務則主要滿足各級政府在交通管理、環境保護、應急響應等領域的AI技術需求。2021年,智慧城市與智能商業兩大業務領域合計營收佔比已接近九成,成為商湯科技的核心收入來源。然而,2022年,隨著這兩大類股的客戶在人工智慧方面的開支大幅縮減,項目建設和部署也相應推遲,導致商湯科技這兩大業務遭受重創。這一年商湯科技智慧城市業務營收為10.96億元,同比下降48.8%,在集團總收入中的佔比從2021年的45.6%下滑至28.8%。智能商業業務營收為14.64億元,同比下降25.2%,收入佔比也從41.7%減少至38.4%。更為重要的是,繼2021年淨利潤虧損超過170億元後,2022年,商湯科技繼續告虧60.45億元。2018年至2024年商湯科技淨利潤趨勢圖(資料來源:wind  馬雲飛 制)2022年末,OpenAI推出的ChatGPT引發行業浪潮,讓正在尋找業績新引擎的商湯科技看到了希望。2023年,商湯科技果斷調整戰略方向,將業務重心轉移至生成式AI領域。與此同時,公司也重新規劃了業務類股,確立了生成式AI、傳統AI以及智能汽車三大業務類股。生成式AI即提供生成式AI的模型訓練、微調及推理服務業務,傳統AI即過去四大類股中的三個的綜合——智慧城市、智慧商業與智慧生活等AI業務,而原來四大類股之一的智能汽車類股保持不變。其中,生成式AI業務位列類股之首。2023年,商湯科技生成式AI收入增至11.84億元,佔比34.8%,較2022年的3.95億元同比增長199.9%。2024年,其生成式AI業務收入24.04億元,同比提升增長103.1%,營收佔比超過六成。商湯科技解釋稱,生成式AI業務的快速增長,主要來源於市場對生成式AI模型訓練、微調和推理的需求爆發性增長,“我們亦繼續將我們的生成式AI相關應用產品商業化,包括在網際網路、智能硬體、機器人、醫療和金融等領域”。降本難解盈利焦慮不過,對於AI公司而言,如何實現大模型的商業化仍然是一個嚴峻的考驗,商湯科技也不例外。2024年是商湯科技成立的第十個年頭。去年10月,商湯科技董事長兼CEO徐立發佈商湯10周年的內部信,稱AI 1.0時代模型生產的主要成本在於研發人員的投入,而在AI 2.0時代,模型生產的成本主要在於算力資源的投入。在組織層面,圍繞戰略和核心資源,商湯科技將建構更加集中和高效的組織架構,推動資源的集中和集約化投入。此後,商湯科技陷入裁員風波,不過彼時官方的回應比較模棱兩可,僅稱“公司在積極推進戰略轉型,聚焦‘大裝置-大模型-應用’重點業務和戰略增長領域,並進行相應的組織和人才結構最佳化和調整。”隨後,2024年12月初,商湯科技宣佈將公司業務架構變為“1+X”:“1”即生成式AI相關業務,包括提供算力的“大裝置”、AI基礎模型和應用;“X”則是智能汽車“絕影”、家庭機器人“元蘿蔔”、智慧醫療、智慧零售等,這些業務將拆分並獨立融資。元蘿蔔機器人 (蔡淑敏 攝)在最新的年報中,商湯科技官方稱,隨著集團不斷深化資源聚焦與效率最佳化的戰略,除了持續投入研發以外,管理與銷售總費用同比下降9.1%。得益於以上舉措,集團在2024年的淨虧損為43.06億元,同比縮窄33.7%。2024年,商湯科技的研發支出從2023年的34.66億元增長19.2%至2024年的41.32億元。官方稱,這主要由於其增加了對訓練和微調基礎模型的投資,以及生成式AI應用開發所產生的折舊和攤銷費用,還有伺服器營運和雲服務費用的增加所致。相比之下,銷售開支與行政均在下降。其中,銷售開支由2023年8.18億元下降20%至2024年的6.55億元,行政開支由2023年的15.1億元減少3.1%至14.64億元。商湯科技稱,主要由於員工福利開支、行銷及差旅開支減少。值得注意的是,截至2024年12月31日,商湯科技的總僱員為3756名,與2023年同期減少了約17%。現金流方面,截至2024年底,總現金儲備為127.5億元,其中包括88.88億元和定期存款29.7億元。全年經營活動所用現金淨額為39.27億元,較2023年擴大,主要因生成式AI業務對算力資源需求增加。除了持續虧損的問題,商湯科技的應收帳款的帳齡仍在持續惡化。截至2024年12月31日,商湯應收帳款為69.74億元,相比2023年同期減少了近10億元,但帳齡惡化,超3年的應收帳款從2023年的15.42億元增長到38.21億元。“我們大部分歷史收入來自智慧城市業務,在付款批核程序的限制下,付款周期長。”商湯科技解釋稱,儘管自2023年以來,商湯整體現金收回情況相對健康,但帳齡相對較長的應收款項的收回情況仍然面臨挑戰,原因為部分客戶——尤其是來自或面向公營機構的客戶面臨暫時的預算限制。 (國際金融報)