#deepseek
“DeepSeek時刻”1年後,市場見證了“Claude衝擊”
AI初創公司Anthropic本周憑藉其企業級產品戰略實現關鍵突破,引發市場對AI競爭格局的重新評估。其工具已在全球股市觸發連鎖反應,軟體、法律、金融資料及地產等多個類股出現顯著市值蒸發,顯示出企業軟體市場正面臨結構性重構。這家成立僅五年的舊金山公司正以約3500億美元估值進行規模相當的融資輪,並計畫年內啟動IPO。自2024年初以來,其年化收入從約10億美元躍升至2025年底的逾90億美元。據媒體援引知情人士,該公司預計2026年底年化收入將突破300億美元,並預計在2028年首次實現盈虧平衡,這一時點較OpenAI提前兩年。本周Anthropic發佈的多款行業專用工具持續引發市場震盪。在最新旗艦模型Claude Opus 4.6推出後,Salesforce、Intuit等軟體公司股價再度承壓。周五高盛宣佈與其合作開發自動化銀行業務AI代理,進一步印證其企業化路徑的有效性。Foundation for American Innovation高級研究員Dean Ball指出,Anthropic模型的迅速普及“是自ChatGPT推出以來AI領域最具影響力的事件”。投資者正押注其工具能夠系統性改造白領工作流程,其目標並非傳統IT預算,而是規模更大的勞動力支出。這標誌著AI競爭已從技術演示階段,進入對企業營運成本結構的實質性替代階段。01企業市場戰略奏效Anthropic 選擇了與OpenAI、Google及Meta差異顯著的商業化路徑,不追求面向消費者的產品,而是將其AI模型定位為服務於開發者和企業的工具型產品。這一戰略在過去一周的市場表現中獲得了有力驗證。根據費用管理初創公司Ramp的資料,Anthropic在今年1月的AI模型API支出市場中已佔據主導地位,份額接近80%。該資料反映了使用者通過第三方服務呼叫AI模型的實際支出情況,儘管此前多項調研顯示OpenAI在企業使用者基數上領先,但Anthropic在企業端的市場吸引力正快速提升。幫助企業建構與管理內部AI工具的初創公司Retool首席執行長David Hsu指出:“Anthropic 始終將重心放在企業市場,而他們發現這一切的關鍵在於‘編碼’。”Menlo Ventures合夥人Matt Murphy透露,Claude Code工具最初為Anthropic內部使用,在驗證其顯著效果後,公司迅速將其轉化為對外產品。本周,Anthropic進一步發佈了一系列面向法律、銷售、金融、行銷及客戶支援等垂直行業的專用“外掛”工具,持續深化其企業服務生態。02編碼能力成為核心競爭力Anthropic去年推出的軟體工程工具Claude Code已成為該領域領導者。該系統能夠讀取企業現有程式碼庫、自主規劃並執行任務,標誌著AI“智能體”能力的初步實現。投資者預期這將開闢廣闊新市場,AI模型開始具備獨立處理複雜任務的能力。該工具已吸引大量開發者,並催生出“Claude benders”這一新興群體,指那些借助該工具進行高強度、馬拉松式應用開發的工作者。早期版本已令軟體工程師驚嘆,部分使用者表示最新模型能將在年計周期的項目壓縮至數周完成。其應用範圍正從程式設計領域向外擴展,延伸至非技術崗位與技術愛好者,使用者對其能夠操控電腦、使用瀏覽器並完成編碼以外任務的能力給予高度評價。儘管面臨Google與OpenAI的激烈競爭(後者本周剛發佈Codex編碼工具的升級版本),有OpenAI支持者指出“編碼市場不等同於企業市場,它本質仍屬開發者領域”。然而,參與Anthropic本輪融資的投資者,包括輝達、微軟以及Lightspeed、紅杉資本、Altimeter Capital等頂尖風投正押注該公司的工具將超越程式碼生成,深入重塑白領工作流程。03安全優先策略的回報Anthropic由前OpenAI研究團隊於2021年創立,聯合創始人包括首席執行長Dario Amodei及其妹妹、總裁Daniela Amodei。Dario Amodei此前曾任Google研究員,因與OpenAI首席執行長Sam Altman意見分歧而離開。該公司始終塑造並保持著一種審慎、注重安全的公眾形象,其首席執行長多次通過長篇部落格文章警示不受約束的AI發展可能帶來的風險,進一步強化了這一特質。2022年,出於對可能引發AI軍備競賽的擔憂,Anthropic主動推遲了其AI模型的公開發佈。同年11月,OpenAI推出ChatGPT並迅速引爆市場,而Anthropic直至數月後才跟進發佈產品。在相當一段時間內,這一推遲策略曾使Anthropic被視為永久落後於OpenAI。然而,其對安全性的長期投入卻在近期市場復甦中發揮了關鍵作用。Anthropic首創了“基於AI反饋的強化學習”技術,旨在確保其模型規避有害或不安全的輸出。與ChatGPT依賴人類對答案質量與安全性進行反饋的機制不同,Anthropic採用AI系統對AI生成內容進行稽核,人類僅提供指導原則。公司高管表示,該方法不僅有助於減少人為偏見,也顯著提升了模型迭代效率。接受英國《金融時報》採訪的12位投資者指出,Anthropic在企業市場的吸引力、清晰的產品聚焦以及穩定的管理層,使其日益被視為比OpenAI更穩健的長期投資選擇。值得注意的是,Anthropic全部七位聯合創始人至今仍在公司任職,而OpenAI自2015年成立以來,11位創始成員中已有8位離職,其首席執行長Sam Altman更在2023年一度遭董事會罷免。04廣告之爭凸顯競爭白熱化Anthropic本周公開承諾不在其產品中引入廣告,以此與已在ChatGPT中測試廣告的OpenAI等競爭對手形成差異化。該公司計畫通過超級碗期間播出的一系列諷刺廣告強化這一立場,廣告中引用Dr. Dre的歌詞:“你我之間有何不同?你說得動聽,卻未行應行之事。”Anthropic總裁Daniela Amodei稱廣告並非針對任何公司,但OpenAI首席執行長Sam Altman在X上直接回應,指責其“明顯不誠實”且“符合Anthropic一貫的雙重標準”。他隨後在科技播客TBPN中淡化此次爭議,稱其為“次要插曲”,並強調“模型能力、產品進展以及圍繞Codex的產業浪潮才是關鍵”。儘管輝達首席執行長黃仁勳等行業領袖警示市場反應可能過度,指出實際平台建構遠比表面複雜,但微軟、亞馬遜、Meta、甲骨文及Google等科技巨頭仍計畫在2026年投入超6000億美元資本支出,規模接近日本同年國家預算,超過德國與墨西哥。Anthropic及其工具的多場景應用,正是驅動此類支出的關鍵因素之一。Battery Ventures普通合夥人Neeraj Agrawal指出,今年企業可能以更審慎的態度評估AI投資,使得勝負格局難以預測。值得注意的是,該公司未投資Anthropic或OpenAI。他稱:“我們正處於AI實驗的高峰期。”當前,風投機構、企業高管與AI研究人員普遍認為,競賽遠未結束,AI技術迭代速度極快,當前領先者可能在短期內被反超。 (華爾街見聞)
僅用38分鐘!深圳一初創企業跑通DeepSeek新模型國產晶片適配
1月27日,DeepSeek團隊發佈了DeepSeek-OCR-2模型。來自深圳的智子芯元公司運用自主研發的KernelCAT工具,僅用38分鐘就完成了這款模型在華為昇騰平台的自動化部署和推理驗證。什麼是AI模型適配?AI模型就像一套複雜的指令,不同的晶片能聽懂的語言不一樣。而AI模型適配國產晶片,就是讓模型能在國產晶片上正常運行,還能發揮晶片性能。過去,適配工作主要依靠工程師進行,不僅耗時久,還相當依賴個人經驗,複雜模型往往需要好幾天才能實現適配。而KernelCAT採用“AI+數學運籌最佳化”雙驅動的算子開發範式,將DeepSeek-OCR-2模型自動遷移至昇騰CANN平台僅用約38分鐘,遷移過程中開發者無需進行反覆試錯或深度干預,相關問題由KernelCAT在執行過程中自動處理,直至完成既定的模型遷移任務。昇騰平台(Ascend)是華為面向全場景AI打造的端邊雲協同全端軟硬體與生態體系,核心是“硬體開放、軟體開源”,為AI訓練/推理提供自主可控的國產算力底座 。據微信公眾號“昇騰CANN”發佈消息,在前序模型DeepSeek-OCR部署任務中,KernelCAT給出的方案較原生Transformers方案的加速效果可達139倍。這一結果表明,在KernelCAT支援下,複雜OCR模型可以在國產算力平台上實現可用、穩定、可復現的工程落地。深圳現有人工智慧企業2600余家智子芯元(深圳)科技有限公司由深圳市巨量資料研究院孵化,成立僅5個月。公司專注於以“數學+AI”最佳化AI計算,通過自動化方式生成高性能算子,持續推動算力底層創新。公司聯合創始人丁添此前在接受媒體採訪時表示,“我們不僅在做一家公司,更在探索數學與AI最本質的結合如何轉化為產業生產力,為這座城市的‘硬’產業,修好最關鍵的那條‘軟’路。”作為國家新一代人工智慧創新發展試驗區和創新應用先導區,深圳擁有良好產業基礎、廣闊市場空間和強勁創新活力,近年來,像智子芯元這樣聚焦晶片、大模型等關鍵賽道攻堅的企業不斷湧現,已成為深圳人工智慧產業的核心競爭力。同時,《深圳市加快打造人工智慧先鋒城市行動計畫(2025—2026年)》《深圳市加快推進人工智慧終端產業發展行動計畫(2025—2026年)》等多項政策接連出台,從政策支援、場景開放、創新賦能、要素保障等維度為人工智慧產業發展提供有力支撐。目前,深圳市人工智慧產業規模位居全國前列,連續兩年實現兩位數增長。現有人工智慧企業2600余家,產業鏈覆蓋晶片、模型、硬體及應用等全環節。 (深視新聞)
國產大模型Kimi K2.5全球多榜單領先,推動AI向智能體演進
當前,全球AI大模型的技術焦點正從“對話互動”轉向“自主執行”。在這一趨勢中,國產大模型正展現出獨特的價值與影響力。近日,人工智慧企業月之暗面正式發佈並開源新一代大模型Kimi K2.5。作為該公司迄今最智能、最全能的模型,K2.5在視覺理解、程式碼生成與Agent叢集協作等方面實現重要突破,被AI業界視為國產人工智慧發展的又一標誌性產品。2025年初,DeepSeek-R1憑藉極高的推理效率火遍全球。一年後,月之暗面通過原生多模態與智能體能力的深度融合,進一步體現了國產基座模型在提升智能“密度”與實用效能方面的進階。隨著以Kimi K2.5為代表的AI大模型加速賦能千行百業,其廣泛的應用潛力越發凸顯。KimiK2.5模型全球多榜單領先自2023年成立以來,月之暗面先以“長文字”功能打開市場,隨後推出基於強化學習的K系列模型。這次K2.5的發佈,意味著公司在基礎模型研發上再進一步。相比2025年7月發佈的K2模型,Kimi K2.5模型意義重大。多項測試表明,K2.5在程式設計、視覺、推理和Agent(智能體)任務等多個領域達到國際先進水平。K2.5讓AI更“親民”。通過融合視覺、推理、程式碼和Agent能力,使用者現在只需拍照、截圖或錄屏,就能讓Kimi理解複雜需求,大大降低了與AI的互動門檻。發佈不到一周,來自美國、英國、德國、西班牙、新加坡等近20個國家超50家主串流媒體對Kimi K2.5進行了報導。該模型發佈後,迅速登上多個權威評測榜單前列。在第三方評測機構Artificial Analysis的最新榜單中,Kimi K2.5綜合性能位列全球前五,僅次於GPT-5.2、Claude Opus 4.5、GPT-5.2 Codex和Gemini 3 Pro Preview這四款閉源模型,在開源模型中居首。圖為評測機構Artificial Analysis發佈的最新模型排名Kimi K2.5還進一步提升了開源模型的程式碼水平,尤其是在前端開發領域,通過融合視覺能力降低了程式設計的門檻。比如,K2.5能自動拆解錄屏背後的互動邏輯,用程式碼進行完整復現。開發者社區的反響也十分熱烈。大模型聚合平台OpenRouter平台資料顯示,K2.5的呼叫量已進入全球前三,且仍在快速增長。LMArena榜單也顯示,其程式碼能力在開源模型中居首,總榜排名前三,是前十名中唯一的中國模型。知名程式設計工具Kilo Code近期資料顯示,K2.5已成為平台上呼叫量最高的模型。在程式設計的實際應用中,因具備視覺理解能力,Kimi K2.5模型也成為多家頭部大廠的首選,展現出廣泛的行業適配性。對普通使用者來說,Kimi K2.5模型將Agent能力擴展到日常辦公領域,它已具備處理Word、Excel、PPT、PDF等常用軟體的高階技能,能幫助使用者直接交付准專業水平的辦公文件。更值得關注的是,Kimi K2.5首次引入了“Agent叢集”能力,可以自主建立多達100個的數字“分身”,按需組成不同角色的團隊,平行工作,團隊作戰,獲得效率的極大提升。例如,使用者輸入40篇論文後,K2.5會先通讀全文,再派生子Agent分別撰寫不同章節,最後由主Agent整合成一份完整的PDF報告。這種“團隊作戰”模式極大提升了效率。圖為評測平台Design Arena發佈的榜單,Kimi K2.5位列第一最新資料顯示,Kimi K2.5已登上評測平台Design Arena榜單首位。該平台主要評測AI大模型的“視覺+互動+創意”能力,此結果印證了K2.5在“設計智能體”領域的綜合領先優勢。隨著應用場景的持續拓展與技術的穩步迭代,Kimi K2.5有望在全球範圍內推動AI應用走向更廣、更深的落地,為各行各業的智能化轉型提供切實助力。國產AI大模型影響力持續提升Kimi K2.5模型的快速破圈,不僅是國產AI模型的一次“實戰測試”,更是中國開源模式憑藉技術能力和性價比優勢在全球舞台嶄露頭角的重要體現。從DeepSeek-R1以強化學習最佳化實現“效率革命”,到月之暗面Kimi K2.5實現原生多模態與智能體叢集能力的融合突破,國產大模型在技術體繫上完成了從單點突破到系統化創新的範式躍遷,影響力持續提升。大模型能力是人工智慧走向規模化應用的核心基石。Kimi K2.5的發佈,體現了人工智慧行業將加速從“聊天互動”轉向以“自主執行”為目標的智能體新階段。以“Agent叢集”為例,過去工程師需要逐行編寫程式碼的複雜流程,如今僅憑一條自然語言指令,即可調度上百個智能體協同作業、平行處理。業內分析認為,這一從“單一模型智能”向“多智能體群體協作”的躍遷,是企業級AI開發的下一個前沿。當前,智能體技術正逐漸從實驗室走向實際應用,進入規模化落地階段。在政策引導與產業鏈協同創新的雙輪驅動下,中國在場景、資料與工程化方面的優勢持續釋放,為AI產業形成全球競爭力奠定了基礎。在市場與資本的雙重助推下,頭部企業正將資源聚焦於下一代技術的攻堅。月之暗面創始人楊植麟表示,下一代模型將採用Kimi Delta Attention新型線性注意力機制,進一步提升短長文字任務性能與速度。同時,未來的大模型還將具備更多“審美”和“價值觀”,擺脫同質化發展。“我們致力於在未來十年、二十年,推動K系列模型從K4、K5到K100實現代際跨越。”楊植麟表示,當前多款中國開源模型已成為事實上的行業基準,“中國技術不僅要好用,還要參與制定規則”。 (瞭望財經)
DeepSeek-OCR-2 正式上線
DeepSeek-OCR-2 正式上線文件解析性能顯著提升昨天,深度求索(DeepSeek)正式推出新一代文件解析模型「DeepSeek-OCR 2」。該模型採用全新的視覺編碼器架構 DeepEncoder V2,在文件解析能力上實現重要突破。技術架構升級視覺因果流 是核心創新,引入類似大語言模型的因果推理機制,使圖像理解更貼近人類閱讀邏輯。視覺編碼器 DeepEncoder:約3.8億參數,用於圖像轉視覺標記序列解碼器:30億參數 MoE 模型,推理時表現為5.7億參數模型性能表現優異OmniDocBench v1.5 測試得分:91.09%,較上代提升3.73%閱讀順序精準率大幅提升純文字提取精度達97%-98%多模態能力突出不僅限於文字提取,還支援:圖表、公式、化學結構識別表格圖像轉 HTML 或 Markdown豐富結構化輸出,滿足多種場景需求開源策略促進發展MIT 許可證開源,可在 Hugging Face 和 GitHub 獲取支援動態解析度與多裁剪策略提供 Transformers 和 vLLM 推理示例部署靈活性優勢本地運行,保障資料隱私支援自訂輸出格式,提示詞靈活引導適用於敏感文件處理場景技術發展前景未來有望擴展至多模態統一編碼器共享因果推理框架,融合圖像、文字、語音等輸入社區驅動開發,加速模型迭代行業影響初顯推動多模態模型走向開源生態打破傳統OCR服務商壟斷格局降低使用門檻,增強市場活力應用場景廣泛涵蓋 OCR、版面解析、圖像描述等任務適合企業級文件處理與科研機構定製化開發本地部署保障資料安全技術路線清晰雙階段訓練策略:先獨立訓練視覺編碼器,再聯合訓練提高OCR魯棒性與佈局適應性市場定位明確精準性高、靈活性強、成本可控超越部分傳統OCR服務通過社區反饋持續最佳化產品體驗小結DeepSeek-OCR 2 的發佈是開源多模態AI的重要里程碑。它不僅提升了文件解析性能,也通過開源策略賦予使用者更高的自由度和掌控力。這一變革或將重塑OCR服務市場的競爭格局,值得長期關注。 (MaXTe)
DeepSeek V4有望深刻改變全球AI的競爭格局
一、核心觀點:AI產業進入"應用落地+格局重塑"關鍵期2025年底至2026年初,全球AI產業正經歷從"技術競賽"向"應用落地"的深刻轉變。本報告揭示了三條主線:AI應用全面加速、國產算力崛起、全球競爭格局重塑。其中,DeepSeek V4的即將發佈被視為可能打破海外封閉模型壟斷的"遊戲規則改變者",而國產晶片訓練大模型、阿里高調進軍AI雲市場等趨勢,標誌著中國AI產業正在走出一條差異化發展路徑。二、AI應用:從"聊天對話"邁向"辦事時代"2.1 大廠佈局全面開啟,生態整合成關鍵蘋果×Google:從"外掛式"到"內植入"的深度合作1月12日,蘋果與Google達成多年戰略合作協議,Google的Gemini核心模型架構將支援下一代Apple Foundation Models。這一合作模式的轉變極具象徵意義——從與OpenAI的"外掛式"服務,變為"內植入"式的底層技術融合。蘋果每年將向Google支付約10億美元技術許可費,新品最快3-4月上線。這反映出蘋果自研模型團隊流失後的戰略調整,也預示著手機端AI應用將在2026年全面加速。阿里千問:全球首個完成真實生活複雜任務的AI助手1月15日,阿里宣佈千問App全面接入淘寶、支付寶、淘寶閃購、飛豬、高德等生態業務,實現點外賣、買東西、訂機票、訂酒店等功能。這標誌著AI助手從"聊天對話"正式邁入"辦事時代"。阿里憑藉豐富的自有生態,在AI Agent落地方面展現出獨特優勢。Meta巨資收購Manus:AI Agent迎來里程碑2025年12月30日,Meta以20億美元收購AI Agent公司Manus。Manus上線僅8個月,年經常性收入(ARR)即突破1億美元。這一收購標誌著AI Agent成為科技巨頭爭奪的下一個戰略高地。2.2 模型呼叫量激增,位元組仍居首位但阿里加速追趕關鍵變化:阿里在Q4加大新產品上線和推廣力度,螞蟻阿福和千問均進入國內AI原生App前五。阿里雲更提出2026年拿下中國AI雲市場增量80%的激進目標,並判斷2026年增量的10%都將大於2025年全量——這意味著阿里預期的2026年AI雲市場規模將數倍於Omdia預測的518億元。三、模型格局:開源vs閉源對抗加劇,DeepSeek V4成關鍵變數3.1 當前模型梯隊分化明顯海外封閉模型:OpenAI GPT-5、xAI Grok 4、GoogleGemini 3 Pro、Anthropic Claude Opus 4.5中國開源模型:DeepSeek-V3.2、阿里Qwen3-Max、月之暗面Kimi K2、小米MiMo-V2-Flash、智譜GLM-4.7、MiniMax M2.1根據Artificial Analysis排名,GPT-5、Claude Opus 4.5、Gemini 3 Pro分列前三,但國產模型緊隨其後,差距正在縮小。3.2 DeepSeek V4:可能改變遊戲規則的"重磅炸彈"核心預期(據媒體披露):發佈時間:2026年2月關鍵突破:程式設計能力超過Anthropic Claude和OpenAI GPT系列開源策略:大機率開源,直接衝擊海外封閉模型的營收根基潛在影響分析:Anthropic是當前AI程式設計領域的領頭羊,其Claude Code年化營收已達10億美元(2025年12月資料),預計2026年目標200-260億美元。若DeepSeek V4以開源方式提供同等甚至更優的程式設計能力,將對Anthropic和OpenAI的營收造成明顯衝擊。更深遠的影響在於:開源模型的性能追趕+成本優勢,可能迫使更多企業轉向第三方架構,打破當前"封閉模型+高溢價"的商業模式。3.3 國產晶片訓練大模型:2026年新趨勢智譜GLM-Image:1月14日發佈,成為首個在國產晶片上完成全程訓練的SOTA多模態模型,基於華為昇騰Atlas 800T A2和昇思MindSpore AI框架。DeepSeek的國產適配進展:2025年9月發佈V3.2-Exp,當天華為昇騰和寒武紀即完成"day 0"適配開源TileLang算子,打破CUDA生態壁壘(程式碼量從500行壓縮至80行,性能提升30%)2025年12月,輝達推出相似度極高的CUDA Tile,側面印證TileLang的技術影響力趨勢判斷:2026年國產模型將更多地選擇在國產晶片上完成訓練,形成"國產模型+國產晶片"的閉環生態。四、算力與國產化:禁令下的機遇與挑戰4.1 輝達H200仍受禁令限制,國產晶片窗口期延續2025年中美政策博弈呈現"多變"特徵:11月:白宮通知不允許輝達向中國出售最新減配版AI晶片12月8日:川普表示允許向"經批准的客戶"出售H2002026年1月17日:輝達供應商因中方禁令暫停H200關鍵元件生產結論:H200仍實質性受到禁令限制,為國產廠商留下持續發展壯大的機會窗口。4.2 華為昇騰:下一代晶片參數曝光關鍵突破:昇騰950PR加入自研HBM HiBL 1.0,從根本上解決被美國禁令限制HBM的窘境。4.3 超節點競爭:國產廠商的規模化突圍戰略意義:通過超節點(Scale Up)的高密度整合,國產廠商以系統層面創新彌補單晶片製程差距。華為Atlas 950/960的超節點規模將數倍於輝達同期產品,形成獨特競爭優勢。五、EDA與半導體:國產化處理程序加速5.1 EDA成為出口管制新焦點2025年美國對華EDA政策反覆:5月29日:停止對華晶片設計軟體(EDA)銷售7月2日:西門子聲明在華開展業務不再需要"政府許可"10月10日:川普宣佈11月1日起對所有關鍵軟體實施出口管制(未落地)市場反應:新思科技中國區收入連續3個季度下滑;楷登電子Q3因禁令放鬆,中國收入同比增長18%。2026年將是AI產業從"技術驗證"走向"商業兌現"的關鍵年份。DeepSeek V4的發佈可能成為打破當前格局的"黑天鵝",而國產算力產業鏈的成熟,將為中國AI產業提供堅實底座。在這一過程中,具備生態整合能力的應用廠商、掌握核心技術的算力供應商、以及突破關鍵卡點的半導體企業,有望獲得超額收益。(TOP行業報告)
DeepSeek,重大發佈!
中國國產AI大模型再度掀起熱潮。今日(1月27日),DeepSeek團隊發佈《DeepSeek-OCR 2: Visual Causal Flow》論文,並開源DeepSeek-OCR 2模型,採用創新的DeepEncoder V2方法,讓AI(人工智慧)能夠根據圖像的含義動態重排圖像的各個部分,更接近人類的視覺編碼邏輯。與此同時,國內人工智慧初創公司月之暗面Kimi正式發佈了新一代開源模型 Kimi K2.5。據介紹,Kimi K2.5基於原生多模態架構設計,支援視覺與文字輸入,將視覺理解與推理、程式設計、Agent等能力全部整合到一個模型當中。另外,阿里昨日(1月26日)晚間正式發佈千問旗艦推理模型Qwen3-Max-Thinking,在多項關鍵性能基準測試中,千問表現超過了GPT-5.2、Claude Opus 4.5 和Gemini 3 Pro等頂尖模型,刷新全球紀錄,進一步拓展了AI系統的推理性能邊界。DeepSeek發佈新模型1月27日,DeepSeek發佈全新DeepSeek-OCR 2模型,採用創新的DeepEncoder V2方法,讓AI能夠像人類一樣按照邏輯順序“看”圖像。這項技術的核心創新在於改變了傳統AI處理圖像的方式。DeepEncoder V2讓AI基於圖像含義動態重新排列圖像片段,而非傳統的從左到右剛性掃描。這種方法模仿了人類追隨場景邏輯流的方式。根據DeepSeek公佈的技術報告,DeepSeek-OCR 2在多項關鍵指標上展現出顯著優勢。在OmniDocBench v1.5基準測試中,該模型取得了91.09%的成績,相較於前代DeepSeek-OCR提升了3.73%。值得注意的是,該模型在保持極高精度的同時,嚴格控制了計算成本,其視覺Token數量被限制在256至1120之間,這一上限與Google的Gemini-3 Pro保持一致。 在實際生產環境中,該模型在處理線上使用者日誌和PDF預訓練資料時的重複率分別下降了2.08%和0.81%,顯示出極高的實用成熟度。根據DeepSeek公佈的技術報告,現有的視覺語言模型(VLMs)通常採用固定的光柵掃描順序(光柵掃描順序)處理圖像切片,即機械地從左上角掃描至右下角。DeepSeek團隊指出,這種方式引入了不必要的歸納偏差,與人類視覺感知背道而馳。人類在閱讀複雜文件、表格或追蹤螺旋線條時,視線是受語義理解驅動的“因果流”,後一次注視往往因果依賴於前一次注視,而非單純的空間坐標移動。受此認知機制啟發,DeepSeek-OCR 2的核心元件DeepEncoder V2被設計用於賦予編碼器因果推理能力。通過引入可學習的“因果流查詢”(Causal Flow Queries),模型能夠在進入LLM解碼器進行內容解釋之前,先在編碼階段就對視覺資訊進行智能重排序。這實際上建構了一個兩級級聯的1D因果推理結構:首先由編碼器在語義上重組視覺Token,隨後由解碼器對有序序列進行自回歸推理。這種設計不僅符合光學文字、表格和公式的非線性佈局特徵,還有效彌補了2D圖像結構與1D語言建模之間的鴻溝。DeepSeek-OCR 2的發佈不僅是一次OCR性能的升級,更具有深遠的架構探索意義。DeepEncoder V2初步驗證了使用語言模型架構作為視覺編碼器的潛力。這種架構天然繼承了LLM社區在基礎設施最佳化方面的成果,如混合專家(MoE)架構和高效注意力機制。DeepSeek團隊認為,這為邁向統一的全模態編碼器提供了一條有希望的路徑。未來,單一編碼器可能通過配置特定模態的可學習查詢,在同一參數空間內實現對圖像、音訊和文字的特徵提取與壓縮。DeepSeek-OCR 2所展示的“兩個級聯的1D因果推理器”模式,通過將2D理解分解為“閱讀邏輯推理”和“視覺任務推理”兩個互補子任務,或許代表了實現真正2D推理的一種突破性架構方法。阿里、月之暗面也有大動作同日,月之暗面Kimi正式發佈了新一代開源模型 Kimi K2.5。此次升級通過靜默推送方式實現在官網聊天介面的自動更新,原K2模型已無縫切換為K2.5,使用者無需手動操作。更新旨在提升響應速度、推理能力與多輪對話穩定性,覆蓋全部Web端使用者。該版本未開放獨立入口或下載安裝包,僅以伺服器端模型替換形式落地。據介紹,作為Kimi目前最智能的模型,K2.5在HLE(人類最後的考試)、BrowseComp、 DeepSearchQA等多項agent評測中均取得全球開源模型的最佳成績。作為一個全能型模型,Kimi K2.5基於原生多模態架構設計,支援視覺與文字輸入,將視覺理解與推理、程式設計、Agent等能力全部整合到一個模型當中。Kimi創始人、CEO楊植麟表示:“我們重構了強化學習的基建,並專門最佳化了訓練演算法,以確保它能達到極致的效率和性能。”另外,阿里巴巴26日晚間正式發佈千問旗艦推理模型Qwen3-Max-Thinking,在多項關鍵性能基準測試中,千問表現超過了GPT-5.2、Claude Opus 4.5 和Gemini 3 Pro等頂尖模型,刷新全球紀錄,進一步拓展了AI系統的推理性能邊界。通過總參數、強化學習、推理計算的極致規模擴展,千問新模型實現了性能的大幅飛躍,刷新科學知識(GPQA Diamond)、數學推理(IMO-AnswerBench)、程式碼程式設計(LiveCodeBench)等多項關鍵性能基準測試的全球紀錄。具體來看,在關鍵的模型推理能力提升中,千問新模型採用了一種全新的測試時擴展(Test-time Scaling)機制,推理性能提升的同時還更經濟。阿里方面表示,Qwen3-Max-Thinking總參數超兆,進行了更大規模的強化學習後訓練,並通過推理技術的系列創新,最終完成模型性能的大幅飛躍。其還大幅增強了自主呼叫工具的原生Agent能力,模型可像專業人士一樣邊用工具邊思考。同時,模型幻覺也大為降低,為解決真實複雜任務打下基礎。目前,普通使用者可通過千問PC端和網頁端試用新模型,千問APP也即將接入,所有使用者都可免費體驗。 (券商中國)
DeepSeek新模型有望解決表格閱讀邏輯問題;Manus將在Instagram擁有快捷入口...
模型與應用Kimi發佈K2.5開源模型,能自主建立Agent叢集處理複雜任務1月27日,月之暗面發佈並開源模型Kimi K2.5。月之暗面稱K2.5為原生多模態模型,同時支援視覺與文字輸入、思考與非思考模式。與半年前發佈的Kimi K2以及後續的Kimi K2 Thinking相比,K2.5實現了「程式碼×視覺」的深度融合,並首創「Agent叢集」能力。程式設計方面,K2.5支援以識別截圖或錄屏的方式生成前端程式碼。比如使用者可以直接上傳一段網頁互動的錄屏視訊,K2.5能夠通過視覺理解自動拆解視訊中包含的動態邏輯(如滾動觸發效果),然後直接生成能夠復現該互動體驗的專業程式碼,無需使用者用文字描述。處理複雜任務時,K2.5能自主建立多達100個分身組成團隊,平行處理1500個步驟,大幅提升長程任務的執行效率。比如在處理複雜的學術研究任務時, 使用者向Agent叢集提交40篇關於心理學和AI的論文,K2.5會自主「分裂」出多個子Agent平行負責不同章節的閱讀與撰寫,最後由主Agent彙總並為質量把關,生成一份長達幾十頁的PDF綜述。參考連結:https://mp.weixin.qq.com/s/Bhn43P1GnGXsvsh5MnN47QDeepSeek發佈並開源視覺語言模型DeepSeek-OCR 21月27日,DeepSeek發佈並開源了新一代視覺語言模型DeepSeek-OCR 2。模型包含一個新的視覺編碼器方案DeepEncoder V2,能讓模型不再按從左上到右下的固定網格方式「機械掃描」,而是能夠根據圖像的語義動態重排要關注的視覺內容,接近人類閱讀複雜文件時的視覺邏輯,即基於上一眼看到的內容決定下一眼看那裡。以往的模型按照固定順序閱讀圖像,在遇到表格、公式、穿插圖文這類並非基於「從左上到右下」邏輯的內容時,就容易出現理解偏差,因為模型「讀對了字」但「沒讀對結構與順序」。DeepSeek-OCR 2在升級之餘也嚴格控制了計算成本,其視覺Token數量被限制在256至1120之間,這一上限與Google的Gemini 3 Pro保持一致。參考連結:https://huggingface.co/deepseek-ai/DeepSeek-OCR-2混元3.0圖生圖模型發佈,生成後能通過互動修圖1月26日,騰訊混元發佈混元圖像3.0圖生圖模型。該模型支援圖片內容的增、刪、改,如消除或增加圖片中的物體或人物、給圖片增加文字等;可以更改圖片風格,如把照片變成漫畫風;還能夠多圖合成,比如把多張照片中的人物或元素提取出來合成照片。在騰訊之前,OpenAI、Google、字節跳動、阿里巴巴等廠商均已推出過類似功能。參考連結:https://mp.weixin.qq.com/s/hzgmBrBCN9wkV6KOAV4_FgMeta在Instagram上線Manus快捷入口1月26日,有報導稱,Meta計畫將近期收購的Manus納入訂閱計畫,一方面將它整合到Meta的產品中,另一方面繼續向企業銷售獨立訂閱。據經常發現未發佈功能的工程師Alessandro Paluzzi在X平台分享的截圖,Meta已經在Instagram上線了Manus的快捷入口。Clawdbot火了,使用者可以通過聊天軟體指揮它操控電腦去年年底,奧地利開發者Peter Steinberger推出了一個開源、可本地化部署的智能體Clawdbot,截至目前,該Agent在GitHub的收藏量超過5萬。Clawdbot相當於一個部署在電腦上的「AI員工」,除了呼叫大模型時需要聯網,資料和記憶都在本地。它能在電腦上執行瀏覽器控制、檔案讀寫、Shell指令碼編寫和運行等任務,具有連接日曆和信箱、設定清單到手機備忘錄等「Skills」,與近期發佈的Claude Cowork等桌面智能體助手功能近似。不同的是,Clawdbot無需在單獨的客戶端裡配置,而是可以通過「閘道器」和WhatsApp、Telegram、iMessage等多個聊天軟體連接起來,成為使用者聊天列表裡的一個「聯絡人」,使用者可以通過聊天軟體跟它對話,由此遠端控制自己的電腦,Clawdbot也能通過聊天軟體主動給使用者發消息。不過,Clawdbot的核心功能依賴於對系統底層權限的獲取,這帶來了一定的安全風險。如果使用者的聊天帳號被盜,攻擊者可以通過對話方塊直接接管整台電腦。AI幻覺也可能導致難以挽回的損失,比如有使用者發帖稱,「在自己的筆記型電腦上部署Clawdbot後,所有的錢都消失了」。Clawdbot的火爆意外帶起了蘋果小型台式主機Mac mini的熱度。儘管Clawdbot可以在任何能運行Node.js的裝置上部署,Mac mini憑藉低功耗、穩定運行、支援iMessage等macOS專屬功能,以及M系列晶片的性能優勢,成為讓Clawdbot「24小時線上」的熱門硬體選擇,社交平台上甚至有不少使用者發帖稱自己為運行Clawdbot專門購買了Mac mini。參考連結:https://github.com/clawdbot/clawdbothttps://www.macstories.net/stories/clawdbot-showed-me-what-the-future-of-personal-ai-assistants-looks-like/其他動態理想全員會上宣佈人形機器人計畫1月26日,有報導稱,理想汽車CEO李想當天召開了一場線上全員會,主要分享了他對AI發展趨勢的看法。李想表示,在汽車之外,理想汽車一定會做人形機器人。他認為,同時佈局基座模型、晶片、作業系統、具身智能等業務的公司,最終全球不會超過3家,理想汽車會努力成為其中一家。另外,他還判斷,今年是所有想要躋身AI行業頭部的公司「上車」的最後一年;L4級自動駕駛最晚2028年一定能落地。同日,理想汽車官方發佈了MEGA的最新銷量資料,自2024年3月開啟交付以來,截至2026年1月,MEGA已累計交付3萬台。參考連結:https://mp.weixin.qq.com/s/iN3zpnZuoxKZq0xNhcfgiA智譜仍在籌備A股上市根據中國證監會更新的公告,智譜的輔導機構中金公司已遞交了智譜的第三期IPO輔導工作進展情況報告,報告落款日期為2026年1月15日。這也意味著,在完成港交所上市、成為「全球大模型第一股」後,智譜仍在持續推進其A股上市計畫。智譜原計畫於A股上市,最初於2025年4月3日向北京證監局提交輔導備案,並於2025年4月14日獲得輔導備案受理,但之後它調整了計畫,於今年1月8日先行登陸港交所主機板。智譜港股上市首日開盤報120港元/股,較發行價高開3.27%,最終收漲13.17%,總市值約579億港元(約合522億元人民幣)。截至1月27日收盤,智譜港股累計漲幅達100.86%,市值1027.50億港元(約合836億元人民幣)。參考連結:https://mp.weixin.qq.com/s/KPLadCDbU3TVsA-_S_pXIQ階躍星辰融資50億元,印奇出任董事長1月26日,階躍星辰宣佈完成超50億元B+輪融資,刷新過去12個月中國大模型賽道單筆融資最高紀錄。參投方包括上國投先導基金、國壽股權、浦東創投、徐匯資本、無錫梁溪基金、廈門國貿、華勤技術等產業投資方,騰訊、啟明、五源等老股東跟投。同日,階躍星辰官宣印奇出任公司董事長,負責公司戰略與技術方向的制定。印奇同時還擔任千里科技的董事長。千里科技第一大股東是吉利汽車,2025年6月,吉利與千里科技、邁馳智行等合資成立千里智駕,各持股30%,吉利將極氪智駕、吉利研究院的智駕團隊與技術注入了該合資公司。特斯拉Robotaxi開始拿掉安全員上周,特斯拉在德克薩斯州奧斯汀市向公眾開放了無安全員的Robotaxi服務,不過車輛投放量極少。1月25日,有海外使用者在社交平台X上發帖稱,自己4天裡花了大量時間嘗試叫到無安全員的Robotaxi,一共試了38次,最終還是沒能成功。特斯拉原計畫在2025年年底前取消安全員,如今晚了差不多一個月。參考連結:https://x.com/DavidMoss/status/2015252404606836832?s=20 (新皮層NewNewThing)
DeepSeek衝擊一年,中國大模型超1500種
DeepSeek在2025年1月給市場帶來衝擊。自那一年之後,中國的AI不斷增加。在美國企業的全球大語言模型排名中,Qwen(千問)、Kimi、MiniMax等中國AI上榜。美國的高科技出口管制是否失去意義?1月2日上市的中國GPU廠商壁仞科技中國新興AI(人工智慧)DeepSeek在2025年1月給市場帶來衝擊。自那一年之後,中國的AI企業不斷增加。不是追隨美國,而是為尋求不同的最佳解決方案走自主路線。其中頗受好評的阿里巴巴集團的股價約1年間上漲了9成。美國的高科技出口管制是否失去意義?2025年1月27日,在蘋果的免費APP下載排行榜上,DeepSeek超過了美國OpenAI的ChatGPT,躍居首位。對於評審前的論文,DeepSeek以有限的計算資源和低成本顯示出很高的推理性能。由於市場擔心不再需要最尖端半導體,2025年1月27日美國輝達的股價一度比上一個交易日下跌18%。提高DeepSeek評價的是大語言模型(LLM)的性能。在美國Artificial Analysis公佈的全球LLM排名中,在Google的Gemini等美國企業佔據前列的背景下,DeepSeek排在第10位。據稱DeepSeek的數學推理能力和性價比均受到好評。在排行榜中,月之暗面(Moonshot AI)開發的Kimi和MiniMax等中國AI緊隨其後。新華社報導稱,中國迄今為止發佈的LLM達到1509種,按國家來看排名第一。在中國AI中,最近一年評價提高的是阿里巴巴的AI模型Qwen(千問)。中國大陸媒體引用美國AI開發平台Hugging Face的資料報導稱,截至2026年1月千問系列的累計下載量超過7億次,成為平台上下載量最多的開源AI。阿里巴巴的股價較2025年1月底上漲約9成,總市值增加約1.5兆港元。除了千問的性能之外,在競爭激烈的中國AI開發中,阿里巴巴還掌握了無論誰勝出都需要的基礎設施,這一點也提高了的評價。美國摩根士丹利認為,阿里巴巴的雲服務在2026年度的收益將同比增長超過35%,2027年度有可能加速至40%。中國企業的戰鬥方式與美國企業不同的情況也很明顯。美國AI以最尖端圖形處理器(GPU)和巨額投資為前提,而中國則以效率化、輕量化為核心確保競爭力。面對尋求提高計算和推理能力的美國企業,中國政府呼籲在各行各業廣泛應用AI,並積極推動其在社會各領域的落地。香港一家亞洲股票基金的營運負責人表示,“雖然不確定能否超越美國的科技水平,但中國正以在受限環境下的強大實裝能力作為武器,開始形成獨特的投資機會”。事實上,中國新興AI企業正在跨越驗證階段,進入產業化和資本回收階段。2025年年底以來,從計算資源到應用,中國大陸的相關企業紛紛在香港上市,包括GPU廠商上海壁仞科技、AI企業MiniMax Group Inc.和北京智譜華章科技、AI製藥企業英矽智能等。那麼美國的高科技出口管制是否不再有意義?答案為一半肯定,一半否定。有報導稱,沒有輝達最先進的半導體,DeepSeek的新模型就無法開發,出口管制的威脅仍未完全消除。另一方面,1月14日有消息稱智譜發佈了在華為提供的平台上開發的國產圖片生成式AI。從獲取資料到學習的全部過程都自主完成,是僅使用中國國產半導體學習的首個最先進的多模態(能橫向處理文字和圖像等不同資料)模型。智譜的股價1月14日在香港市場一度上漲22%。對純中國產AI的評估才剛剛開始,2026年中國AI股的狂熱似乎仍將持續。 (日經中文網)