#Deepseek
全網都在猜DeepSeek V4的發佈時間,但中國模型激戰還有一條暗線
傳言會在春節期間發佈的DeepSeek V4,還沒現身。2026年1月初,外媒援引了兩名直接瞭解Deepseek發佈計畫的知情人士消息,稱DeepSeek計畫在春節期間推出其下一代旗艦模型V4。一石激起千層浪,2025年春節前夕,DeepSeek曾發佈了震撼全球的 R1 模型,導致美股AI類股劇烈波動,也樹立了中國開源模型以性能逼近全球頂尖閉源模型,效率和性價比超越閉源模型的信心。在爆料傳出前後,DeepSeek團隊密集發表了兩篇由創始人梁文鋒署名的重磅論文,被業內視為V4發佈的“預演”:1月1日發佈的mHC(流形約束超連接),解決了模型越大訓練越容易崩潰的穩定性難題 ;1月12日聯合北大發佈的Engram(條件記憶),讓模型面對熟悉知識時直接查表呼叫,把算力留給真正需要深度推理的複雜任務 ,同時實現計算與記憶體解耦。這些跡象更讓開發者和分析師堅信,DeepSeek已經完成了V4的技術儲備。野村證券甚至在2月10日的報告中,提前預告DeepSeek將於2月中旬發佈V4,指出V4的重點不在於參數競賽,而在於通過Engram和mHC技術打破晶片和視訊記憶體瓶頸。開發者在DeepSeek的FlashMLA開源推理庫中發現了一個代號為“MODEL1”的程式碼標識。它的架構參數與目前的 V3 有顯著差異。這被技術圈解讀為V4正在進行最後的工程部署測試。技術社區流傳著一句笑談,整個中國AI圈都在緊鑼密鼓地準備“V4陪你過春節”。01. DeepSeek V4何時來?然而截至發稿,DeepSeek V4還是沒有正式發佈。但是在2月11日,有使用者發現,DeepSeek的App版本號更新為1.7.4,離線狀態下可呼叫的知識庫截止時間為2025年5月,更值得注意的是,模型的上下文窗口從128K提升至1M(100 萬 Tokens),儘管上下文翻了8倍,但首字生成速度反而有所提升,體驗非常絲滑。同時,模型的表達風格發生了明顯的變化,大量使用者吐槽回覆變得“爹味”或“冷淡”,失去了V3版本那種靈動、幽默的對話感。從社交媒體來看,大部分人認為這就是V4的“搶先體驗版”或“性能閹割版”,提前灰度測試,再發佈完整版。有開發者猜測,DeepSeek這次灰度測試的其實有兩個大小不同的版本。小版本參數量200B左右,大版本參數量達到1.4T。而大參數量的版本,性能應該是對標Claude Opus4.6的。而且,從目前放出的版本來看,依然沒有“多模態”。DeepSeek還是在繼續堅持純語言路線。但是,接近DeepSeek的人士透露,“這不是V4,就是一個小版本更新。”2025年春節開始,DeepSeek一直處於聚光燈下,但是卻低調地可怕。DeepSeek的公眾號自2025年1月20日更新R1之後,一共發佈了10篇文章,篇篇10w+,置頂的是《DeepSeek-V3.1發佈,邁向Agent時代的第一步》。只有模型版本的更新會發佈官方公眾號,而重要論文、開源成果等,僅發佈arXiv和官方程式碼倉庫。全年幾乎沒有任何高管公開對外發出除了技術分享之外的聲音。所以,這次萬眾矚目的DeepSeekV4春節發佈,成了一場“全民猜猜看”遊戲,官方一直沒有任何回應。02. V4魅影之下,沒人敢鬆懈國產晶片及大模型基礎設施廠商,是DeepSeek新版本發佈前最積極的“猜猜看”參與者之一。能否在V4發佈的第一時間提供完整適配支援,已成為檢驗廠商技術實力與服務響應速度的試金石,也直接決定了能否搶佔流量紅利的第一波紅利窗口期。各個廠商的人互相打聽DeepSeekV4發佈的時間,但是所有人都沒有確切消息。一家國產晶片廠商的工程師說:“DS這個沒人知道確切時間,都在等著它降臨。”“DeepSeek給到的資訊太少了,但是就是有預警,我們都得帶著電腦回家。”另外一家晶片廠商同樣表示在時刻準備著DS的發佈。還有傳言表示,DeepSeekV4會在大年三十或大年初一直接“炸場”。全行業都在S級預警中,準備在春節期間,做Day0(24小時之內)窗口期適配。03. 激戰的國產大模型與DeepSeek靜悄悄相對應的是,整個大模型行業,早已經卷了起來。從Kimi K2.5於1月27日發佈 ,選擇的時機很好,正值個人Agent開源框架OpenClaw大火。這個由Peter Steinberger打造的本地自託管AI助手項目,兩周內在GitHub突破15萬Stars,而K2.5的特性恰好與之高度契合。K2.5具有原生多模態視覺編碼能力,以及可自主調度多達100個子智能體、平行處理1500個步驟的Agent叢集(Agent Swarm),近兩周後便以1.16兆token的周呼叫量登上了OpenRouter總榜榜首,超過Gemini 3 Flash和Claude Sonnet 4.5。隨後,開源社區中,一個神秘的Pony Alpha模型於2月初以“匿名模型”的方式出現在OpenRouter,主打編碼、推理和智能體工作流最佳化 ,可以執行長程Agent任務和複雜系統工程,總參數744B、啟動參數僅40B,首次整合DeepSeek Sparse Attention大幅降低部署成本 ,2月11日被智譜官方確認就是GLM-5 ,智譜官方也特別強調,GLM-5的模型體感可以對齊Opus4.5。隨著GLM-5的官宣,智譜港股近四日累計漲幅超110% ,僅2月12日當天就一度漲超41%,收盤漲28.68%,總市值達1792億港元。智譜在上線GLM-5的同時,也宣佈GLM Coding Plan套餐漲價30%起,被長江證券解讀為國產大模型從“燒錢拓客”階段正式進入需求驅動時代。就在同一天,MiniMax悄悄上線M2.5,啟動參數量僅10B,每秒輸出100 token的情況下連續工作一小時僅需1美元,官方稱具備了“像架構師一樣思考和建構”的能力,期待能夠加速全面Agent時代的到來。股價在過去五個交易日累計上漲約35%。同樣也在模型官宣稿件中提到,綜合來看,M2.5與Opus4.5表現相當。Openclaw的火爆是一個偶然也是一個必然,AI創業者Jayden提到:“行業太需要一個for個人的、開源的Agent框架,不是Openclaw也會是別的。”這個純靠技能、記憶與API協議持續工作的“無頭智能體”從概念走向可用,從需求側倒逼了大模型的能力演進方向:Agent的自主規劃、多步工具呼叫、長期上下文記憶特性,再加上7×24小時常駐運行的需求,讓Token消耗從傳統問答式的零散消耗,變成規模化、持續性的巨量消耗直接將模型競爭的核心維度推向了“Agentic工具編排能力、長程任務規劃、持久化記憶與超長上下文處理”這一新範式。在這一範式下,ClaudeOpus4.6的能力是行業公認的天花板。從各方猜測來看,對DeepSeekV4的期待,也是能夠追趕或者拉平Opus4.6的能力,同時性價比更高。在DeepSeekV4之前,各家模型廠商,已經開始搶佔這個賽道。“很關鍵的一點,傳聞DeepSeek V4很強,所以晚發不如早發,撞車等於白髮。所以大家現在的策略就是‘搶跑’,趁著超級頭部還沒扔‘核彈’之前,先把自己的牌打出去。一旦DS V4發佈且效果炸裂,輿論關注度會被瞬間吸乾,那時候再發模型就真的‘發了個寂寞’了。”一位大模型演算法工程師說。“太累了,即使不在公司,也得帶著電腦。但是沒辦法,現在也是一個範式的升級期,如果不證明自己跟上了步伐,後果很可怕。”開源社區也有各種爭論,國產模型的使用體感還是和Opus4.6差太多。但是,2026年上市的大模型公司智譜AI和Minimax,市值都已經衝擊2000億港元大關。“Agentic(智能體化) 是預訓練和RL+PostTrain(後訓練強化學習)之後第三個模型比較大的範式。而我們在這裡面又看到了開源模型的SOTA,資本市場認可的主要是這個邏輯。”一名券商首席分析師指出。置頂的DeepSeek文章,突出的也是“Agentic”。DeepSeekR1引發上一波熱潮,也是大模型上一個範式進化之時。國產大模型激戰背後,DeepSeek給到的壓力只是一方面,另外一條更重要的暗線是,在範式轉換之時,沒有一家大模型廠商“敢掉隊”,保持在牌桌上至關重要。最後,還有一個問題,不按常理出牌的Deepseek,真的會陪我們過春節嗎? (騰訊科技)
野村:全球人工智慧趨勢追蹤報告:人工智慧專題研究
《全球人工智慧趨勢追蹤報告》5個核心觀點。一、DeepSeek-V4 或許會延續演算法方面的創新路徑,然而並不會再次上演 V3/R1 等級那樣的全球衝擊。報告表明,DeepSeek-V4預估會在2026年2月中旬進行發佈,有可能在程式設計、超長程式碼處理以及推理可靠性等方面達成突破。然而,和一年前V3/R1所引發的市場震動不一樣,全球主要雲服務商,也就是CSP,已然加快朝著通用人工智慧,即AGI的方面邁進,不間斷的算力投入致使市場對於新模型的衝擊具備更強的韌性。所以,V4更大機率會促使中國AI產業鏈創新周期加快,而不是去顛覆全球AI基礎設施市場的格局。二、mHC與Engram技術架構代表大模型效率最佳化的新方向近期,DeepSeek發表了兩篇論文,這兩篇論文揭示了V4可能採用的核心技術,其中,流形約束超連接(mHC)通過改進殘差連接機制實現了更深網路層間的穩定資訊流,Engram條件記憶模組則通過解耦記憶與計算,把靜態知識檢索任務從Transformer計算中剝離。這兩項創新分別從訓練穩定性和記憶體效率角度,為突破”晶片牆“和”記憶體牆“提供了工程化解決方案。三、演算法創新正在重構AI價值鏈的成本收益結構通過雙隨機矩陣約束以及Birkhoff多面體投影的mHC機制,在維持深層訊號傳播穩定性之際降低梯度爆炸風險;Engram借助把百億級參數的記憶表解除安裝到CPU記憶體,使得推理吞吐量損失能夠忽略不計(<1%)。這樣一種“以演算法換算力”的路徑,讓國產AI晶片於訓練失敗率較高的當前狀況下,依舊能夠經由架構最佳化達成可用性能,進而加速國產算力的大規模運用。四、開源模型生態從DeepSeek單極主導走向多元競爭有資料顯示,DeepSeek V3以及R1,在2024年年底的時候,曾經佔據OpenRouter開源模型token消耗量的50%還要多,然而到了2025年下半年,其份額已經明顯下降,Qwen、Llama、Mistral等模型形成了“夏季拐點”之後的碎片化局勢。這表明開源大模型市場正從單一技術領先者的紅利時期,進入到多玩家技術迭代與生態競爭的新的階段。五、AI應用層正從對話工具向複雜任務執行體演進觀察到有報告稱,豆包AI手機,還有阿里通義APP,已然能夠自動開展多步驟任務,這意味著AI智能體(也就是Agent)開始從那種”對話式互動“狀態朝著”任務型助手“方向轉型。這種演進會明顯使得token消耗量和算力需求有所增加,原因在於複雜任務的執行需要更加頻繁地與大模型進行互動,這樣一來,就有可能把模型效率提升所帶來的單次呼叫成本下降給抵消掉。(TOP行業報告)
春節見?DeepSeek下一代模型:“高性價比”創新架構,助力中國突破“算力晶片和記憶體”瓶頸
野村證券認為DeepSeek即將發佈的新一代大模型V4,可能通過創新架構mHC和Engram技術進一步降低訓練和推理成本,加速中國AI價值鏈創新周期。同時有望幫助全球大語言模型和AI應用企業加速商業化處理程序,從而緩解日益沉重的資本開支壓力。野村證券指出,DeepSeek即將發佈的新一代大模型V4,預計不會像去年的V3一般引發全球AI算力需求的恐慌。但它可能通過兩項底層架構創新,加速全球大語言AI應用的商業化處理程序。華爾街見聞提及,據報導DeepSeek新一代旗艦模型V4預計將於2026年2月中旬面世。內部初步測試表明,V4在程式設計能力上超過了目前市場上的其他頂級模型,如Anthropic的Claude和OpenAI的GPT系列。一個核心問題再次浮現:V4會再次顛覆全球AI價值鏈嗎?野村證券在2月10日發佈的《全球AI趨勢追蹤》報告中給出了明確的判斷:不會。研報指出,這次發佈的意義在於V4可能通過創新架構(mHC和Engram技術)進一步降低訓練和推理成本,加速中國AI價值鏈創新周期。同時有望幫助全球大語言模型和AI應用企業加速商業化處理程序,從而緩解日益沉重的資本開支壓力。01 創新技術架構帶來性能與成本最佳化報告指出,算力晶片和記憶體一直是中國大模型的瓶頸。而V4有望引入的兩項關鍵技術——mHC和Engram,從演算法和工程層面針對這些硬約束最佳化。mHC:全稱為“流形約束超連接”。它旨在解決Transformer模型在層數極深時,資訊流動的瓶頸和訓練不穩定的問題。簡單說,它讓神經網路層之間的“對話”更豐富、更靈活,同時通過嚴苛的數學“護欄”防止資訊被放大或破壞。實驗證明,採用mHC的模型在數學推理等任務上表現更優。(超連接與流形約束超連接)Engram:一個“條件記憶”模組。它的設計理念是將“記憶”與“計算”解耦。模型中的靜態知識(如實體、固定表達)被專門儲存在一個稀疏的記憶體表中,這個表可以放在廉價的DRAM裡。當需要推理時,再去快速尋找。這釋放了昂貴的GPU記憶體(HBM),讓其專注於動態計算。(Engram架構)研報指出這兩項技術的結合對中國AI發展意義重大。用更穩定的訓練流程(mHC)彌補國產晶片可能存在的不足;用更聰明的記憶體調度(Engram)繞過HBM容量和頻寬的限制。野村強調V4最直接的商業影響就是進一步降低大模型的訓練與推理成本,這種成本效益的提升將刺激需求,屆時中國AI硬體公司將受益於加速的投資周期。02 硬體受益於“加速周期”野村認為全球主要雲服務商正全力追逐通用人工智慧,資本開支的競賽遠未停歇。因此V4預計不會對全球AI基礎設施市場造成去年那種等級的衝擊波。不過全球大模型及應用開發商正背負著日益沉重的資本開支負擔。V4若能如預期般,在維持高性能的同時顯著降低訓練與推理成本,將成為一劑強心針。它可能幫助這些玩家更快地將技術轉化為收入,緩解盈利壓力。報告回顧了DeepSeek-V3/R1發佈一年後的市場格局。此前DeepSeek的兩個模型V3和R1的“算力管理效率”疊加“性能提升”加速了中國LLM與應用發展,也改變了全球與中國大語言模型競爭格局,並推動開源模型更受關注。(OpenRouter上排名前15的開源模型每周Token消耗量)在2024年底,DeepSeek的兩個模型曾佔據OpenRouter上開源模型Token使用量的一半以上。但到了2025年下半年,隨著更多玩家加入,其市場份額已顯著下降。市場從“一家獨大”走向了“群雄割據”。這表明,僅憑單一模型的高效,已不足以統治快速演進的開源生態,如今V4面臨的競爭環境,遠比一年前複雜。03 軟體或迎來“增值而非被替代”在應用側,更強大、更高效的V4將催生更強大的AI智能體。報告觀察到,像阿里通義千問App等,已經能夠以更自動化的方式執行多步驟任務。這意味著,AI智能體正從“對話工具”轉型為能處理複雜任務的“AI助手”。這些能執行多工的智能體,需要更頻繁地與底層大模型互動,這將消耗更多的Token,進而推高算力需求。因此,模型效能的提升不僅不會“殺死軟體”,反而為領先的軟體公司創造了價值。野村強調,需要關注那些能率先利用新一代大模型能力,打造出顛覆性AI原生應用或智能體的軟體公司。它們的增長天花板可能因模型能力的飛躍而被再次推高。 (硬AI)
中國AI人,“三年沒過好年”了
“以這個春節為分界點,AI將真正走嚮應用元年。”年味又從手機螢幕裡溢出來了,與之同步的還有AI炮火的硝煙。春節前最後一周,打工人的一天是這樣的:早上到工位,先用千問APP點一杯阿里請客的奶茶,再去元寶APP抽今天騰訊發的紅包,順手把紅包連結分享到微信群。摸魚的時候用豆包生成一段拜年小影片,順便和摸魚搭子吐槽:連結又被遮蔽了,APP又崩了。這股賽博年味之火熱,以至於微信都嫌棄病毒式傳播的紅包污染了內容生態,把自家元寶和對家千問的紅包口令全部遮蔽了。到目前為止,騰訊宣佈發紅包10億,千問30億,百度5億;未公佈獎池總金額的豆包和螞蟻阿福,也不動聲色地開始了宣推。四捨五入,大家今年都要參與不下50億的大項目。巨頭們還憋著別的大招。紅包戰中格外低調的字節,在節前最後一周推出了視訊生成新模型Seedance2.0,幾天之內驚豔全球。Seedance2.0生成的視訊阿里仍在緊鑼密鼓地推進從外賣奶茶到酒店訂票的各種業務和千問的合併,騰訊則把AI社交工具“元寶派”的開放加速提上日程。字節跳動用火山引擎和豆包深度繫結了央視春晚互動,千問就一口氣冠名了4家地方台春晚。這些動作指向一個目的:給自家AI產品拉新,在春節這個巨大的池子裡搶流量。而這麼一來,今年春節的情形也已經可以預見了——中國人的生活、社交、娛樂,大機率要被AI包圍。熱鬧之中容易被忽略的一件事是,鋪天蓋地的紅包和反覆崩壞又被修復的系統背後,是巨頭們豪擲的預算和告急的算力,薅羊毛玩得不亦樂乎的打工人背後是另一群打工人。過不好年的AI人“三年沒過好年了。”某大廠一位AI業務高管對我們感嘆。一位騰訊AI團隊的員工告訴我們,元寶產品團隊過去半年基本沒休息過,春節期間也得堅守崗位。另一位阿里員工則說,為了把外賣、酒旅、電商這些業務和千問打通,公司內部成立了多個跨部門的AI項目,性質是“一號位等級”“高度保密”。項目核心成員春節期間必須在崗,各部門工程師也需要抽調去加班,今年春節安排加班的規模數量遠超去年。有位程式設計師在Github開發者社區上發了帖子,“可不可以不要在春節前或春節期間出DeepSeek V4,打工牛馬們想過個好年。”不少人跟著附議。圖源:網路AI從業者傅易跟我們總結,今年大廠裡最沒得休息的是兩撥人。一撥是C端AI產品團隊,也就是風暴中心的元寶、千問、豆包等,為了打好流量仗,必須時刻待命,隨機應變。另一撥是後端的維運工程師。算力緊缺導致系統崩壞,是春節期間確定性最高的突發狀況之一,意味著越是閤家團圓的熱鬧時刻,這些後端人員越要緊張地值守,密切關注GPU的負載。但緊張的又何止大廠。中小AI企業同樣在尋求從流量池中分到一杯羹。一家AI創企的創始人告訴我們,公司在節前一個月就已經進入了備戰狀態。春節是個巨大的機會池。去年春節,DeepSeek火爆到因為算力緊張陷入癱瘓,一批中小規模雲服務平台緊急調度算力,各自接住了一波寶貴的流量;各行各業的公司、機構批次宣佈緊急部署DeepSeek,反應靈敏的AI服務企業們賺得盆滿缽滿。去年春節,DeepSeek橫空出世另一邊,上游的GPU公司同樣緊張。他們忙於調度算力,以及為可能到來的算力荒做應急預案。據我們瞭解,三巨頭為了迎接春節期間的巨大流量,已經提前鎖定了市場上幾乎所有算力。於是不少中小企業乃至頭部大廠,把目光轉向了中國國產算力,以及如何利用技術方案最佳化效率。中國國產GPU廠商不敢鬆懈。如果早有準備且運氣足夠好,新模型或新應用走紅後,它們能以最快的速度,為客戶提供最易於部署、最節省算力、使用體驗最好的算力基礎設施和技術方案,從中贏得訂單和口碑、流量和資本,甚至是一夜成名的機會。當然,對應的付出就是,他們也很難過個安生年了。AI應用爆發前夜對中國人而言,網際網路巨頭商戰、加班,早已不新鮮,三瓜倆棗的春節紅包也不足為談。但多年後再次回頭看,很多人可能仍會發現,自己的習慣和生活,又一次被時代微妙地改寫了。縱觀中國網際網路史,從入口網站到移動支付,再到電商、短影片,重大的技術普及幾乎都從娛樂化起步。尤其在春節這樣的“非生產性時間窗口”,AI應用的可玩性、可傳播性,會短暫地取代生產力,成為最重要的競賽維度。所以即便硝煙中不乏“海外巨頭在卷技術,中國巨頭在卷紅包”的質疑,這場春節之戰仍然必定會是中國國產AI一次頗有價值的嘗試——中國企業第一次把大模型的能力和各種成熟的C端場景大規模結合起來,利用一個全民等級的流量窗口,做一次規模巨大的商業化實驗。網友參加AI APP“請客”活動最終,不論是字節的“短影片+AI”、騰訊的“社交+AI”,還是阿里的“本地生活+AI”,任何一個實驗成功,都會成為一個歷史性的案例。以此為轉折點,AI在“把硬體重做一遍”玩到過剩之後,開始真正變革軟體市場。隨之而來的,就是以這個春節為分界點,AI將真正走嚮應用元年。技術底座和市場空間都已足夠有想像力。一方面,2025年大模型的迭代頻率已經進化到以月為單位,再往後,可能絕大部多數C端使用者很難再感受出模型能力的差別。另一方面,最近發佈的第57次《中國網際網路絡發展狀況統計報告》顯示,截至2025年底,中國生成式人工智慧使用者規模已經達到6.02億人,普及率達到了42.8%。在此基礎上,幾大巨頭在春節檔上不斷加碼的火力,標誌性意義不言自明:今年春節將會成為AI流量入口之爭的第一戰。更何況這次,還不只是藍綠對決,而是多方混戰;紅包和行銷預算的體量,也從幾千萬拉到了幾十億。場面只會更熱鬧。各自的探索一個新生事物從已經平靜多年的網際網路行業裡冒出來,迅速生長為龐然大物,機會與風險相伴而生,讓很多人手足無措。元寶和千問紅包刷屏後,分享連結先後遭到微信的遮蔽。一位騰訊人士告訴我們,這背後既有微信團隊自身的產品潔癖,也有其作為數字基礎設施的監管考量。阿里的動作更果斷。春節活動上線前兩天,馬雲現身杭州阿里總部千問春節項目組,媒體爆料圖片上,他身旁放著“千問C端事業群”的立牌。圖源:網路這個事業群成立於去年年底,打通了整個阿里產品生態,各個業務單元提煉出自身的工具能力,由千問統一呼叫。事業群成立一個多月後,千問宣佈,全面接入淘寶、支付寶、淘寶閃購、飛豬、高德等集團生態業務。整合內部的分歧很重要,探索產品的未來也是這個節點最關鍵的命題。傅易覺得,相較去過去兩年DeepSeek、Sora這些戲劇性地跑出來的爆款,今年反而是確定性較高的一年。頭部模型能力已不分伯仲,算力資源也高度集中,今年即便有爆款,大機率也是幾家大廠的計畫內產物,再出現一匹無名黑馬的機率很低。但這也意味著,非頭部的AI企業今年會面臨更大的不確定性。前述AI創企高管坦言,今年,中小公司會更被動。在流量戰中與大廠同台競爭幾乎無勝算可言,但鑑於過去三年的經驗,機會仍有可能出現,只是大家都不確定它會以何種形式出現,又該以何種姿態去承接。所以,金字塔尖之外的大部分從業者當下的狀態是,“不知道該如何準備,但也不敢不準備。”“到最後無非都是拼運氣。”他如此總結。無論如何,AI應用的黃金時代,即將從這個兵荒馬亂的春節,正式開始了。但對抗並非唯一的主基調,在這個無人區,任何一個人的努力和探索,都將成為其他人前進的踏腳石。很多企業昨天還是對手,今天就轉向合作,圍坐暢談、互通有無;資訊快速地流動,五道口的咖啡館裡坐滿了人,AI是最高頻出現的詞彙,海內外的從業者們在播客、直播間等各種平台不斷連線交流;企業之間人才不斷流動,但始終是那一批人,讓關於某家公司有何新動作的情報幾乎透明。這裡的從業者有種特徵,步履匆匆、早出晚歸,健談且樂於分享,雙眼閃亮,不知疲倦。支撐他們的,是期待與渴望。“主動願意加班的人還是挺多的,大家都想抓住這次機會。”傅易說。傅易今年28歲。和他年齡相仿的網際網路從業者們,見證了上一代移動網際網路開荒者們的職業高光:成為高管、成功創業、財富自由。他們以此為目標捲進大廠,卻又遇上技術紅利逐漸殆盡,只能在已經穩定的系統裡以“打螺絲”自嘲。他們大多心有不甘,期待著那個屬於這一代網際網路人的風口到來。這是很多AI人內心深處的動力。他們強烈地預感到,它來了。 (吳曉波頻道)
去年DeepSeek,今年SeeDance!從國運級到地表最強
對歷史的最好紀念,就是創造新的歷史。去年DeepSeek,今年SeeDance。2025年新年,DeepSeek-R1亮相,《黑神話:悟空》製作人馮驥,稱之為“國運等級的科技成果”。2026年2月9日,馮驥在即夢的Seedance 2.0視訊生成模型後,給出了新的判詞:當前地表最強的視訊生成模型,沒有之一。AIGC的童年時代,結束了。我很慶幸,至少今天的Seedance 2.0,來自中國。01 “國運級”鋪墊 “殺死比賽”降臨2025年,馮驥在評價DeepSeek時,驚嘆於其同時實現了強大、便宜、開源,這看似難以共存的特質。一年後,震撼的焦點從文字與推理轉向了視訊與創造。在2026年2月9日的點評中,馮驥將Seedance 2.0定義為“當前地表最強的視訊生成模型,沒有之一”。他指出,其核心突破在於“全能”,AI理解並整合文字、圖片、視訊、音訊等多模態資訊的能力完成了一次飛躍。他預測,該模型將使得一般性視訊的製作成本迅速趨近於算力的邊際成本,引發內容領域“史無前例的通貨膨脹”,並徹底重構影視行業與傳統工作流程。影視颶風創始人Tim在最新視訊中表示:按照2026年初Seedance視訊模型的能力,傳統影視流程已進入被AI海嘯沖走的倒計時。同時Tim也警告,當一個人的圖像和聲音資料進入了AI的資料集,模型可以100%地模擬出這個人的任何形態和聲音。這並非小革新,而是會推走影視行業過去所有流程和沉澱的海嘯。基哥試用了下Seedance 2.0,不僅能從簡單的文字描述中生成電影感十足的鏡頭,更能實現“自分鏡、自運鏡”,根據故事情節自動規劃拍攝手法。它支援同時輸入最多12個圖片、視訊、音訊檔案作為參考,精準控制人物、動作、風格和音效。更關鍵的是,其生成視訊的可用率據多位測試者反饋高達90%以上,遠超行業平均水平,使得創意落地的成本與時間呈數量級下降。根據大家的的反饋,該模型在鏡頭運動和一致性方面超越了 OpenAI 的 Sora 和快手的可靈。02 這不是“更便宜的電影” 而是“另一種藝術”Seedance 2.0,它在使用手冊標題的最後,寫著Kill the game!(殺死比賽)。這個評價,相當客觀。AIGC的童年時代,結束了。傳統影視製作,成本結構是典型的“工匠式”的:人力、時間、實體資源堆疊。而Seedance 2.0所代表的範式,其成本核心是“計算式”的:一段60秒高品質視訊的成本,從近萬元的專業製作費用,壓縮至近乎可忽略的算力消耗與幾分鐘的等待時間。視訊正從一種需要精心策劃、高昂投入的“稀缺資源”,轉變為一種可以按需、即時、海量生成的“基礎設施”。一切需要展示的環節:從電商廣告、產品預覽、教育講解到個性化敘事,都將被輕易地“視訊化”。這不再是“用更便宜的方法拍電影”,而是“視訊成為一種新的通用語言”。03 小結短劇行業不再“抽卡”。以前做一分鐘可用的AI視訊,因為要反覆‘抽卡’重試,實際API成本是理論成本的五到十倍。現在,成本幾乎等於理論成本。同樣的素材,給不同的人剪,結果天差地別。而這套經驗,正是影視從業者相對於AI視訊玩家最大的壁壘。Seedance 2.0的出現,真正可怕的是:它在直接拆這條護城河。不知道字節給 Seedance 2.0 喂了多少素材,才把模型推到這個層級。 但至少從這次展示來看,字節這條路線,是真的走對了。Seedance 2.0將生成成功率,與質量提升到新高度。有機構表示,Seedance在AI漫劇和模擬人劇已經達到了工業級標準。這對於本就追求極致效率與成本控制的短影片、行銷廣告及新興的AI漫畫劇賽道而言,意味著生存法則的巨變。舊童年的結束,是一個新神話的開篇。去年DS,今年SD。但更值得注意的是,今年的SD可能不止一個,而是一批。 (奇偶工作室)
Claude Opus 4.6 天價發佈、DeepSeek 的物理極限、下周宏觀避險指南
今天忙著體驗Opus 4.6,文章寫的有點晚了,真的太有意思了,就是真的太貴了!!!尤其是今天出的這個Claude Opus 4.6的急速模式(Fast mode),那更是一個貴字了得,反正我是沒敢用。這個急速模式和Opus 4.6性能一致,但速度達到了正常模式下的2.5 倍!更離譜的是價格較Opus 4.6翻了6倍!!!6倍價格換2.5倍速度,從純數學角度看,這筆帳確實不太划算。但商業世界從來不是純數學,對於業餘碼農來說可能不影響什麼。但是對於一個正在緊急修複線上事故的工程師來說,每多等10秒鐘,都意味著更多的使用者流失和更大的業務損失。對於用Claude Code快速迭代產品原型的獨立開發者來說,省下的時間可以直接換算成更早的上線日期。“Anthropic將Fast Mode定義為一次早期的市場實驗。其核心意圖在於探索:在模型‘智力’競爭已趨於白熱化(甚至觸及天花板)的當下,‘速度’這一新維度,究竟能支撐起多大的商業想像空間。”開放模型運行速度提升2.5 倍,成本卻高出6 倍較小的批處理規模。Deepseek 的帕累托最優曲線(解讀:在多個目標互相衝突時,你能達到的“物理極限邊界”)呈現如下狀態:Claude Opus 4.6 版本為 100 Tok/s/使用者Deepseek 在 100 時為 6 千 Tok/s/GPU以每秒 250tok/使用者計算,實際接近 1k。什麼是 100 tok/s?(使用者體驗層)這是一個衡量標準。100 tok/s/使用者 意味著使用者在螢幕上看到文字生成的速度是每秒 100 個 token(約 70-80 個漢字)。對人類閱讀來說,這個速度極快,體驗非常好(幾乎不需要等待)。2. GPU 吞吐量對比(成本效率層)當兩家模型都強制要求達到這個“絲滑速度”時,效率差異就體現出來了:為什麼Claude Opus和DeepSeek差這麼多仍然要發佈?從某種意義上說,這是在‘AI通膨’背景下的一次關鍵試探。當前,AI通膨在成本端已十分顯著(如雲端H100算力價格的飆升),這種壓力正逐漸向下游傳導。關鍵在於,這種漲價能否像Claude一樣最終由終端使用者買單(即使用者願意支付更高的Token費用)。如果這一步走通了,AI Agent(智能體)的商業邏輯將徹底理順:行業將從單純依賴Capex(資本支出)的‘軍備競賽’,轉向具備真實造血能力的商業閉環。這才是對市場質疑最有力的回應。昨天說今天要聊宏觀,玩AI玩過頭了。宏觀就是一句話,風險是否正在醞釀?簡單說一些關鍵,雖然上周各大類資產(如大宗商品、外匯)的波動率已經開始抬頭,但利率市場的波動率依然被壓制在較低水平 。這種背離現象背後的邏輯是:市場對宏觀經濟“軟著陸”的基本共識尚未動搖,但對單一資料點的敏感度正在急劇上升 。退一步來看,“雖然宏觀大背景未變——美國經濟增長向好、通膨態勢緩和,但風險依然存在。鑑於當前就業增長已顯疲態,一旦勞動力市場進一步放緩,此前的樂觀預期將面臨考驗。目前,市場焦點已鎖定下周的非農就業資料,以判斷利率波動率是否會再度抬頭。”美國:就業資料成為市場波動的總開關美國市場目前處於高度緊繃狀態。儘管整體增長前景依然具有支撐性,通膨也在降溫,但本周疲軟的職位空缺和初請失業金資料打破了平靜,成為了避險情緒的催化劑 。市場對下周非農就業資料的敏感度已顯著提升 。這成為了決定後續行情的關鍵分水嶺:風險情景:如果失業率出現反彈跡象,意味著勞動力市場未能走穩,那麼被壓抑的利率波動率將瞬間爆發,市場將劇烈震盪 。基準情景:如果失業率保持穩定或小幅下降,聯準會將繼續維持“觀望”模式,這將有助於穩定前端利率,讓市場重回平靜 。宏觀先聊到這,下周主要的宏觀資料大家心裡有數即可,明天有時間再聊,我又要去幹Opus 4.6了,真的很多想法需要他去實現!今夜註定是不眠夜。 (北向牧風)
“DeepSeek時刻”1年後,市場見證了“Claude衝擊”
AI初創公司Anthropic本周憑藉其企業級產品戰略實現關鍵突破,引發市場對AI競爭格局的重新評估。其工具已在全球股市觸發連鎖反應,軟體、法律、金融資料及地產等多個類股出現顯著市值蒸發,顯示出企業軟體市場正面臨結構性重構。這家成立僅五年的舊金山公司正以約3500億美元估值進行規模相當的融資輪,並計畫年內啟動IPO。自2024年初以來,其年化收入從約10億美元躍升至2025年底的逾90億美元。據媒體援引知情人士,該公司預計2026年底年化收入將突破300億美元,並預計在2028年首次實現盈虧平衡,這一時點較OpenAI提前兩年。本周Anthropic發佈的多款行業專用工具持續引發市場震盪。在最新旗艦模型Claude Opus 4.6推出後,Salesforce、Intuit等軟體公司股價再度承壓。周五高盛宣佈與其合作開發自動化銀行業務AI代理,進一步印證其企業化路徑的有效性。Foundation for American Innovation高級研究員Dean Ball指出,Anthropic模型的迅速普及“是自ChatGPT推出以來AI領域最具影響力的事件”。投資者正押注其工具能夠系統性改造白領工作流程,其目標並非傳統IT預算,而是規模更大的勞動力支出。這標誌著AI競爭已從技術演示階段,進入對企業營運成本結構的實質性替代階段。01企業市場戰略奏效Anthropic 選擇了與OpenAI、Google及Meta差異顯著的商業化路徑,不追求面向消費者的產品,而是將其AI模型定位為服務於開發者和企業的工具型產品。這一戰略在過去一周的市場表現中獲得了有力驗證。根據費用管理初創公司Ramp的資料,Anthropic在今年1月的AI模型API支出市場中已佔據主導地位,份額接近80%。該資料反映了使用者通過第三方服務呼叫AI模型的實際支出情況,儘管此前多項調研顯示OpenAI在企業使用者基數上領先,但Anthropic在企業端的市場吸引力正快速提升。幫助企業建構與管理內部AI工具的初創公司Retool首席執行長David Hsu指出:“Anthropic 始終將重心放在企業市場,而他們發現這一切的關鍵在於‘編碼’。”Menlo Ventures合夥人Matt Murphy透露,Claude Code工具最初為Anthropic內部使用,在驗證其顯著效果後,公司迅速將其轉化為對外產品。本周,Anthropic進一步發佈了一系列面向法律、銷售、金融、行銷及客戶支援等垂直行業的專用“外掛”工具,持續深化其企業服務生態。02編碼能力成為核心競爭力Anthropic去年推出的軟體工程工具Claude Code已成為該領域領導者。該系統能夠讀取企業現有程式碼庫、自主規劃並執行任務,標誌著AI“智能體”能力的初步實現。投資者預期這將開闢廣闊新市場,AI模型開始具備獨立處理複雜任務的能力。該工具已吸引大量開發者,並催生出“Claude benders”這一新興群體,指那些借助該工具進行高強度、馬拉松式應用開發的工作者。早期版本已令軟體工程師驚嘆,部分使用者表示最新模型能將在年計周期的項目壓縮至數周完成。其應用範圍正從程式設計領域向外擴展,延伸至非技術崗位與技術愛好者,使用者對其能夠操控電腦、使用瀏覽器並完成編碼以外任務的能力給予高度評價。儘管面臨Google與OpenAI的激烈競爭(後者本周剛發佈Codex編碼工具的升級版本),有OpenAI支持者指出“編碼市場不等同於企業市場,它本質仍屬開發者領域”。然而,參與Anthropic本輪融資的投資者,包括輝達、微軟以及Lightspeed、紅杉資本、Altimeter Capital等頂尖風投正押注該公司的工具將超越程式碼生成,深入重塑白領工作流程。03安全優先策略的回報Anthropic由前OpenAI研究團隊於2021年創立,聯合創始人包括首席執行長Dario Amodei及其妹妹、總裁Daniela Amodei。Dario Amodei此前曾任Google研究員,因與OpenAI首席執行長Sam Altman意見分歧而離開。該公司始終塑造並保持著一種審慎、注重安全的公眾形象,其首席執行長多次通過長篇部落格文章警示不受約束的AI發展可能帶來的風險,進一步強化了這一特質。2022年,出於對可能引發AI軍備競賽的擔憂,Anthropic主動推遲了其AI模型的公開發佈。同年11月,OpenAI推出ChatGPT並迅速引爆市場,而Anthropic直至數月後才跟進發佈產品。在相當一段時間內,這一推遲策略曾使Anthropic被視為永久落後於OpenAI。然而,其對安全性的長期投入卻在近期市場復甦中發揮了關鍵作用。Anthropic首創了“基於AI反饋的強化學習”技術,旨在確保其模型規避有害或不安全的輸出。與ChatGPT依賴人類對答案質量與安全性進行反饋的機制不同,Anthropic採用AI系統對AI生成內容進行稽核,人類僅提供指導原則。公司高管表示,該方法不僅有助於減少人為偏見,也顯著提升了模型迭代效率。接受英國《金融時報》採訪的12位投資者指出,Anthropic在企業市場的吸引力、清晰的產品聚焦以及穩定的管理層,使其日益被視為比OpenAI更穩健的長期投資選擇。值得注意的是,Anthropic全部七位聯合創始人至今仍在公司任職,而OpenAI自2015年成立以來,11位創始成員中已有8位離職,其首席執行長Sam Altman更在2023年一度遭董事會罷免。04廣告之爭凸顯競爭白熱化Anthropic本周公開承諾不在其產品中引入廣告,以此與已在ChatGPT中測試廣告的OpenAI等競爭對手形成差異化。該公司計畫通過超級碗期間播出的一系列諷刺廣告強化這一立場,廣告中引用Dr. Dre的歌詞:“你我之間有何不同?你說得動聽,卻未行應行之事。”Anthropic總裁Daniela Amodei稱廣告並非針對任何公司,但OpenAI首席執行長Sam Altman在X上直接回應,指責其“明顯不誠實”且“符合Anthropic一貫的雙重標準”。他隨後在科技播客TBPN中淡化此次爭議,稱其為“次要插曲”,並強調“模型能力、產品進展以及圍繞Codex的產業浪潮才是關鍵”。儘管輝達首席執行長黃仁勳等行業領袖警示市場反應可能過度,指出實際平台建構遠比表面複雜,但微軟、亞馬遜、Meta、甲骨文及Google等科技巨頭仍計畫在2026年投入超6000億美元資本支出,規模接近日本同年國家預算,超過德國與墨西哥。Anthropic及其工具的多場景應用,正是驅動此類支出的關鍵因素之一。Battery Ventures普通合夥人Neeraj Agrawal指出,今年企業可能以更審慎的態度評估AI投資,使得勝負格局難以預測。值得注意的是,該公司未投資Anthropic或OpenAI。他稱:“我們正處於AI實驗的高峰期。”當前,風投機構、企業高管與AI研究人員普遍認為,競賽遠未結束,AI技術迭代速度極快,當前領先者可能在短期內被反超。 (華爾街見聞)
僅用38分鐘!深圳一初創企業跑通DeepSeek新模型國產晶片適配
1月27日,DeepSeek團隊發佈了DeepSeek-OCR-2模型。來自深圳的智子芯元公司運用自主研發的KernelCAT工具,僅用38分鐘就完成了這款模型在華為昇騰平台的自動化部署和推理驗證。什麼是AI模型適配?AI模型就像一套複雜的指令,不同的晶片能聽懂的語言不一樣。而AI模型適配國產晶片,就是讓模型能在國產晶片上正常運行,還能發揮晶片性能。過去,適配工作主要依靠工程師進行,不僅耗時久,還相當依賴個人經驗,複雜模型往往需要好幾天才能實現適配。而KernelCAT採用“AI+數學運籌最佳化”雙驅動的算子開發範式,將DeepSeek-OCR-2模型自動遷移至昇騰CANN平台僅用約38分鐘,遷移過程中開發者無需進行反覆試錯或深度干預,相關問題由KernelCAT在執行過程中自動處理,直至完成既定的模型遷移任務。昇騰平台(Ascend)是華為面向全場景AI打造的端邊雲協同全端軟硬體與生態體系,核心是“硬體開放、軟體開源”,為AI訓練/推理提供自主可控的國產算力底座 。據微信公眾號“昇騰CANN”發佈消息,在前序模型DeepSeek-OCR部署任務中,KernelCAT給出的方案較原生Transformers方案的加速效果可達139倍。這一結果表明,在KernelCAT支援下,複雜OCR模型可以在國產算力平台上實現可用、穩定、可復現的工程落地。深圳現有人工智慧企業2600余家智子芯元(深圳)科技有限公司由深圳市巨量資料研究院孵化,成立僅5個月。公司專注於以“數學+AI”最佳化AI計算,通過自動化方式生成高性能算子,持續推動算力底層創新。公司聯合創始人丁添此前在接受媒體採訪時表示,“我們不僅在做一家公司,更在探索數學與AI最本質的結合如何轉化為產業生產力,為這座城市的‘硬’產業,修好最關鍵的那條‘軟’路。”作為國家新一代人工智慧創新發展試驗區和創新應用先導區,深圳擁有良好產業基礎、廣闊市場空間和強勁創新活力,近年來,像智子芯元這樣聚焦晶片、大模型等關鍵賽道攻堅的企業不斷湧現,已成為深圳人工智慧產業的核心競爭力。同時,《深圳市加快打造人工智慧先鋒城市行動計畫(2025—2026年)》《深圳市加快推進人工智慧終端產業發展行動計畫(2025—2026年)》等多項政策接連出台,從政策支援、場景開放、創新賦能、要素保障等維度為人工智慧產業發展提供有力支撐。目前,深圳市人工智慧產業規模位居全國前列,連續兩年實現兩位數增長。現有人工智慧企業2600余家,產業鏈覆蓋晶片、模型、硬體及應用等全環節。 (深視新聞)