面對美國AI算力制裁，科大訊飛、MiniMax等5家中國公司用大模型實力回應

2025/01/16

•

美國公佈新一輪全球AI算力出口管制的不到48小時內，五家中國 AI 企業不約而同都發佈大模型新品和相關技術進展，用“實力”進行回應。

鈦媒體AGI獲悉，1月15日上午，AI上市公司科大訊飛發佈國產深度推理大模型“訊飛星火X1”，這是科大訊飛與華為聯手訓練出的中國首個基於全國產算力的具備深度思考和推理能力的大模型，對標OpenAI o1系列，中文數學能力國內第一，並率先應用於教育、醫療等剛需場景。同時，科大訊飛還公佈訊飛星火4.0 Turbo升級版、國內首個具備端到端語音到語音同傳能力的星火語音同傳大模型。

幾乎同一時間，“大模型六虎”MiniMax和月之暗面也分別推出全新模型和服務。此外，15日下午，AI視訊模型公司生數科技對外公佈Vidu 2.0版本，生成速度最快不到10秒，單秒視訊成本僅需“4分錢”；面壁智能則公佈端側4o即時語音互動模型MiniCPM-o 2.6，具備全模態，端到端，即時音視訊通話。

截至目前，全球 AI 企業總量超過4萬家，其中，中國生成式 AI 產業蓬勃發展，中國生成式 AI 產品使用者規模高達2.3億人，產業規模和產品數量迅速增加，初步建構了較為全面 AI 產業體系，相關企業超過4500家，核心產業規模已接近6000億元，產業鏈覆蓋晶片、演算法、資料、平台、應用等上下游關鍵環節。同時，中國已經完成備案並對外服務 AI 大模型超過270個，總註冊帳戶數超過13億。

在美國不斷加大 AI 限制之下，中國 AI 創業公司正在用實力與美國頂尖技術進行比拚。

AI“國家隊”出擊：國產深度推理大模型“訊飛星火X1”多項能力超o1

1月15日，科大訊飛公佈訊飛星火X1、訊飛星火4.0 Turbo升級版、具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型三款產品。

首先，訊飛星火X1是基於全國產算力平台上唯一的深度推理大模型，與通用大模型相比，訊飛星火X1解題過程更接近人類的“慢思考”方式，不僅精準給出答案，還對解題思路和步驟進行了詳細拆解，且化繁為簡，將複雜問題分步拆解簡化，進行自我探索和反思驗證，以及基於答案正確與否的優質反饋資訊進行強化訓練。在小初高（含競賽）、大學（含競賽）等多項中文“考試”中，訊飛星火深度推理模型X1用更少的算力，多項指標國內第一，能力超過美國OpenAl公司的o1、o1 Preview模型。此外，醫療領域，訊飛星火X1可使得專科輔助診斷和複雜病歷內涵質控精準率均達90%。

科大訊飛還宣佈，將在今年上半年正式發佈基於訊飛星火X1的醫療大模型升級版。

其次，訊飛星火4.0 Turbo也全面升級，數學能力、行業知識、圖文識別、長文字能力等能力上實現提升，全面對標GPT-4o。其中，訊飛星火4.0 Turbo圖文識別能力升級，使通用文件版面分析、文字辨識的精準率相對提升40%，複雜表格結構、潦草手寫文字等方面精準率相對提升60%，大幅提升高價值資料獲取能力，而基於“技術+應用”不斷正向循環，訊飛星火4.0 Turbo在金融、油氣、能源、電力、鋼鐵、航司等領域綜合能力的絕對提升全部超過10%。

最後，科大訊飛發佈國內首個具備端到端語音同傳能力的大模型——星火語音同傳大模型，可以最快實現僅5秒的同傳時延，達到人類專家譯員水平，在內容完整度、資訊精準度以及語言質量上與GPT-4o旗鼓相當。發佈會上，科大訊飛透露，針對語音到語音的同傳場景，訊飛翻譯機將會組態耳機、音箱、麥克風，在2025年推出商務套裝，滿足使用者在不同商務洽談場景使用需求。

事實上，科大訊飛於2019年、2022年曾兩次被列入美國實體清單，最終成功應對。科大訊飛表示，其核心技術研究和產品開發平台逐步實現全面自主可控，在國產算力建構高性能模型已經有良好基礎。

當前，科大訊飛正全面發力 AI 大模型商業化。財報顯示，2024年前三季度，科大訊飛實現營業收入148.49億元，同比增長17.73%；歸屬於上市公司股東的淨利潤虧損3.44億元。

其中，2024年第三季度，科大訊飛實現營業收入55.25億元，同比增長15.77%；歸屬於上市公司股東的淨利潤5696.14萬元，同比增長120.87%，在加大星火大模型研發投入和佈局的同時，實現利潤當季度轉正。

科大訊飛董事長劉慶峰曾於去年1月提到，2024年訊飛大模型四大年度戰略目標：星火通用大模型國內領先對標GPT-4；賦能智能硬體終端1000萬、獨立軟體使用者數過億；教育、醫療、汽車等多個領域行業市場第一；匯聚100萬大模型開發者打造行業第一生態。

科大訊飛近期表示，星火大模型商業化已經得到初步驗證，在消費者、教育、醫療、汽車等已有場景中加快規模化落地，商業價值閉環已得到初步驗證；同時，以大模型為切入點，在營運商、金融、能源、交通等重點行業做深做透，與央國企戰略合作深度營運有望打開增量空間；此外，科大訊飛希望通過先發優勢，打造iFlyCode、招采、會議、文件、翻譯等標準化產品，企業市場的規模化推廣實現商業價值。

生數公佈4分錢AI視訊模型Vidu，“大模型六虎”發力新技術落地

1月15日下午，生數科技發佈AI視訊模型Vidu 2.0，在速度、價格和模型效果上展現出新的競爭力。

速度方面，Vidu 2.0實現秒級生成，視訊生成速度突破至10秒以內，相較於之前版本提升三倍，大幅領先於國外同類產品。對於廣告製作、影視動畫等專業場景，將帶來顯著的效率提升。例如傳統1分鐘廣告片交付周期約1個月，Vidu 2.0理想狀態下僅需5分鐘就能產出足夠素材。

價格上，Vidu 2.0推出全新套餐，直接將成本降至單秒視訊僅需4分錢，橫向對比，其720P收費僅為行業平均的43%，不到業內平均價格一半。這意味著百元左右就能產出1分鐘商業片，極大降低了創作成本。與此同時，還上線 “錯峰模式”，支援閒時不限量生成，不扣積分，進一步為使用者降低使用門檻。

模型效果上，Vidu 2.0也實現全面升級。在風格一致性上，能完整理解並保持風格元素，如在油畫、水墨等風格生成中表現出色，遠超其他競品；鏡頭運動表現自然流暢，對鏡頭運動指令理解到位；首尾幀性能提升，過渡更加絲滑，場景和鏡頭切換更具想像力；參考生視訊穩定性更強，主體相似度更高。

值得一提的是，Vidu研發團隊也罕見公佈了營運資料。據悉，自2024年7月底全球上線以來，Vidu 僅用了20天使用者數就突破百萬，上線100天使用者數就突破千萬，截至目前來自全球200個國家和地區使用者在 Vidu 平台上共計生產了上億條視訊。

另外，“大模型六虎”於15日公佈了 AI 大模型產品進展。

其中，MiniMax發佈並開源新一代01全新系列模型，參數量高達4560億，其中單次啟動459億，包含基礎語言大模型MiniMax-Text-01和視覺多模態大模型MiniMax-VL-01，同時能夠高效處理全球最長400萬token上下文，是GPT-4o的32倍，Claude-3.5-Sonnet的20倍，而且MiniMax-01系列模型是該公司首次大規模實現線性注意力機制，傳統Transformer架構不再是唯一的選擇。
月之暗面則公佈Kimi多模態圖片理解模型moonshot-v1-vision-preview API，100萬tokens售價12元起。

MiniMax認為，2025年將是 AI Agent（智能體）高速發展的關鍵年份，無論是單Agent系統還是多Agent系統，都需要更長的上下文來支援持續記憶和大量通訊。MiniMax-01系列模型推出將滿足新需求，邁出建立複雜Agent基礎能力的第一步。

目前，MiniMax-01系列開源模型已應用於MiniMax旗下產品海螺AI，並在全球範圍內上線，企業與個人開發者可前往MiniMax開放平台使用API。

生成式AI產業轉向商業化，美國“打不死”中國 AI 發展

中國生成式 AI 支出和產業規模不斷擴張。

據IDC統計，2022年，全球 AI 總投資規模為1324.9億美元，並有望在2027年增至5,124.2億美元，年複合增長率31.1%。預計到2027年，45%的企業將掌握並使用生成式 AI 來共同開發數字產品和服務從而推動收入增長。

多個資料預測，到2027年，全球生成式AI市場規模將接近1500億美元。其中，中國生成式 AI 市場規模將達到400億美元以上。

ChatGPT風靡全球兩年多時間裡，中國出現了300多個大模型。截至目前，10億參數規模以上大模型數量更是超過了100個，遠超美國大模型數量。

性能方面，中國後來居上，比如阿里雲通義千問大模型Qwen2-72B模型，在性能上不僅超過了文心4.0、豆包pro、混元Pro等國內的閉源大模型，也超越了美國最強開源模型Llama3-70B。

北京市科學技術研究院科技情報研究所書記、所長張士運認為，中國 AI 快速崛起並非偶然，背後離不開多重因素的協同作用。

不過，生成式 AI 的應用仍然處於早期階段，在企業層面落地仍面臨許多挑戰。比如，資料處理工具和解決方案面臨缺失，算力與模型適配面臨困境，大模型部署複雜性和協同難度大，應用難題亟待解決等。

2024世界智能製造大會期間發佈的資料顯示，中國已建成1200多家先進級智能工廠和230多家卓越級智能工廠。全球172家“燈塔工廠”中有72家建在中國，佔比超過42%。截至2024年10月底，智能製造裝備產業營收同比增長28%，工業軟體產品收入同比增長7%，智能協作、物流倉儲機器人產量持續領跑全球。

劉慶峰認為，國內大模型將從“百模大戰”轉向若幹個“主要玩家凸顯”態勢。中國必須要有自主可控、對標國際一流通用大模型。通用大模型每次迭代都將“淹沒”一批弱的行業模型和應用。

中國科學院腦科學與智能技術卓越創新中心研究員張鐵林指出，文字大模型更新迭代處理程序明顯受到了文字資料量和資源條件方面的限制。一方面，現今網際網路上公開的人類自然語言文字語料，在很大程度上都已被機器“學習利用”。另一方面，訓練千億甚至兆參數AI大模型，不僅要耗費巨量電力能源，還需要數以萬計AI晶片提供算力支援，這無疑意味著巨額資本投入。一些急於看到回報的資本開始紛紛撤離，導致那些缺乏支援的 AI 大模型項目不得不停滯。因此，在短期內能否發展出具備人腦綜合高級認知能力的AI大模型，仍需進一步觀察和研究。

對於美國《人工智慧擴散出口管制框架》新規即將實施，甲骨文執行副總裁肯·格魯克表示，“美國此舉等於把百分之八十的全球市場拱手送給中國”。

Google前首席執行官埃裡克·施密特（Eric Emerson Schmidt）近期對中國 AI 看法發生了180度轉變。他認為，事實是，中國 AI 技術看起來已經追上了美國，尤其是限制高性能晶片供應給中國之後發生的事。

展望未來，特斯拉CEO埃隆·馬斯克（Elon Musk）則預言，通用人工智慧（AGI）將最快在2025年底實現，2027年和2028年 AI 可能比人類的全體智慧還要聰明。這意味著，如果到2030年 AI 超過了人類智能的總和，AI將承擔大部分知識性工作。

全球範圍內，AI 將逐步演變為一種新的基礎設施，深刻改變社會運作模式和經濟發展邏輯，從工業到醫療，從教育到文化，AI 以獨特方式塑造未來社會，也為建構更加智能化、互聯化社會提供了無限可能。

按照中國《新一代人工智慧發展規劃》，到2025年，中國 AI 基礎理論實現重大突破，部分技術與應用達到世界領先水平，AI 成為帶動中國產業升級和經濟轉型的主要動力，智能社會建設取得積極進展。到2030年，AI 理論、技術與應用總體達到世界領先水平，成為世界主要 AI 創新中心，智能經濟、智能社會取得明顯成效，AI 產業競爭力達到國際領先水平。形成涵蓋核心技術、關鍵系統、支撐平台和智能應用的完備產業鏈和高端產業群，AI 核心產業規模超過1兆元，帶動相關產業規模超過10兆元。

智源研究院創始理事長，美國國家工程院外籍院士張宏江對鈦媒體AGI表示，物理模型、世界模型是人類走向AGI的必經之路，2025年 AI 領域一定會有一些突飛猛進的進展。

張士運強調，當前這個轉折點上，中國 AI 不僅要致力於成為技術領導者，更要努力成為未來社會發展方向的塑造者，把握這一機遇，我們將迎來一個更加智慧、更加可持續發展的未來。 (鈦媒體AGI)