#deepseek
DeepSeek預測加密行情:XRP上看8美元、以太坊挑戰10000 下個百倍幣是這個!
加密市場在連續數月承壓之後,關於2026年的價格想像開始回到主流視野。近期有市場文章引用DeepSeek人工智能的推演結果,對XRP、比特幣與以太坊提出偏樂觀的路徑假設,甚至認為未來10個月內存在再創新高的可能。這類預測的價值,往往不在於精準命中某個數字,而在於它把市場關心的核心變數整理成更容易理解的框架,例如監管清晰度、機構資金進場、供給收縮與鏈上應用的擴張速度。需要強調的是,加密資產屬高風險類別,任何模型輸出都不等同結論,更不構成投資建議。AI預測的定位與可信度邏輯把AI輸出當作行情指南很容易走偏,較合理的用法是把它視為情境整理器。DeepSeek在預測中透過經過校準的提示,給出對3個主流資產的目標價,同時也補上推動因素與可能的催化劑。若這些因素在未來逐步落地,價格就可能沿著更強的趨勢前進,反之則會回到震盪或下修。換句話說,預測數字只是尾端結果,真正影響市場的是中間那串條件是否被實現。在XRP部分,預測提到Ripple重申XRP在長期戰略中的核心地位,目標是把XRP Ledger推向全球採用的企業級支付網路。XRPL的優勢被描述為結算速度快、交易費用低與基礎設施成熟,並可能受益於穩定幣與現實世界資產代幣化兩個成長領域。這種敘事的關鍵在於需求是否能外溢到鏈上交易量與企業整合,若僅停留在口頭合作,對估值支撐會相對有限。價格層面,預測指出XRP現價約1.37美元,DeepSeek給出的2026年目標為8美元,約為現水位6倍。技術指標描述上,RSI約40偏中性,價格走勢貼近30日均線,暗示長時間盤整可能接近尾聲。推動上行的潛在事件則包含美國上市的XRP ETF若能推出,可能引發機構關注度提升,Ripple國際合作若持續擴大也可能帶來信心加分。監管面方面,若美國CLARITY法案在年內獲通過,市場對合規邊界的想像會更具體,風險折價也可能下調。比特幣的目標價:供給收縮與機構採用比特幣部分,DeepSeek把目標價設定在266000美元附近,並延續比特幣作為數字黃金的定位,強調其對抗通膨與宏觀風險的吸引力。回顧比特幣曾在10月6日創下126080美元高點,之後進入回調;在市值結構上,比特幣約占2.4兆美元加密總市值中的1.3兆美元。從歷史高點回落後,跌幅約48%,現階段價格約66000美元,並提到地緣政治不確定性曾引發2次較明顯拋售。驅動比特幣再走強的理由主要集中在2個面向,第一是機構採用加速,第二是減半後新增供給下降。機構採用若持續擴張,會把買盤從週期型資金轉向長期配置,進而提高市場底部的穩定度。供給端若在減半後變得更緊,需求只要維持就更容易造成價格擡升。預測還加入一個更具爆發性的政策變數,美國若推動戰略比特幣儲備,將會改變部分市場參與者對長期需求的想像,並可能提高估值上限。不過,政策承諾到實際執行之間存在時間差,也存在路徑變動風險,因此更適合作為情境,而非必然事件。以太坊的10000預期:結算層與機構部署以太坊部分,預測把ETH定位為領先的智能合約公鏈與DeFi主要底層。數據引用顯示以太坊市值約2350億美元,DeFi鎖定資金超過530億美元,仍是鏈上交易的重要結算層。它被看好的理由包含安全記錄、穩定幣領域的主導地位,以及在現實世界資產代幣化方面較早啟動的進展。若機構需要一個更成熟的智能合約平台來部署資本,以太坊往往是優先選項之一。DeepSeek提出以太坊瞄準10000美元的方向,但也承認關鍵門檻在監管清晰度。預測直接把CLARITY法案視為重要條件,因其可能提供機構部署所需的確定性。價格結構方面,ETH目前約2000美元,5000美元被描述為主要阻力區,並引用去年8月曾到4946.05美元的歷史高點。若能突破5000美元並站穩,上行路徑可能加速,甚至在聖誕節前推進到7500美元的區間想像。這類推演的核心仍是資金是否願意把以太坊當作長期金融基礎設施配置,而不只是短線波動工具。而DeepSeek提出此時也是布局下個百倍幣良機,市場正關注以下新幣預售。Bitcoin Hyper加速崛起引爆Layer2新敘事Bitcoin Hyper($HYPER)代幣的預售在尚未結束前已累積突破3166萬美元,這個數字不僅代表資金高度集中,也顯示出比特幣Layer2敘事在2025的強勢回歸。其采用Solana虛擬機設計,使比特幣主網能首次以極低成本與高速度處理智能合約、遊戲、支付與模因相關應用。這種結構上的融合,使比特幣長期以來的不可編程限制得到突破,讓BTC真正具備跨鏈價值捕捉能力。Bitcoin Hyper在技術路線上選擇透過非托管橋接方式帶入BTC,避免了中心化跨鏈橋長期存在的安全隱患。這種設計提升資金的流動效率,使BTC的Layer2部份具備可拓展的使用場域。從交易費支付到跨鏈交互,乃至治理與節點運行,HYPER將成為整個網絡的能源基底。這些特性不僅提升使用彈性,也擴大比特幣生態向DeFi與遊戲化應用延伸的空間。其代幣HYPER目前價格為0.0136763美元,並采用每3天自動調漲模型,近日有鯨魚更一次過用近9萬美元掃入,使預售具備節奏性,促使早期參與具有明確優勢。新版經濟模型將質押年化調整為37%,使獎勵結構更接近長期可持續性,取代過往許多預售項目過度激進的高收益陷阱。主網計畫於2026年第1季啟動,屆時Bitcoin Hyper將從敘事階段正式轉入落地階段,市場對其的預期也將從情緒層面轉為體驗層面。官網購買Bitcoin Hyper代幣結論DeepSeek對2026年的推演,用XRP上看8美元、比特幣目標266000美元與以太坊挑戰10000美元,描繪出一張偏樂觀的加密市場地圖。其背後依賴的條件大致可歸納為監管清晰度提升、機構採用深化、供給端收縮,以及代幣化與穩定幣等應用擴張。另一方面,Bitcoin Hyper等預售則代表另一條高波動路徑,以較小市值換取更大的倍數想像。當市場同時存在成熟資產的結構性敘事與新項目的注意力競爭,最重要的差異不在口號,而在風險承受能力與資金期限是否匹配。免責聲明加密貨幣投資風險高,價格波動大,可能導致資金損失。本文僅供參考,不構成投資建議。請自行研究(DYOR)並謹慎決策。
DeepSeek V4 炸場發佈:中國晶片算力大爆發,終結輝達壟斷GPU時代
這兩天,DeepSeek V4 炸了的消息一個接著一個的。中國的人工智慧可能無需依賴輝達了!DeepSeek V4 的試行版本 Sealion-lite 洩露,其上下文窗口已擴展至 100 萬個 token,具備原生的多模態推理能力。根據提前洩露的測試樣本,其程式碼最佳化和邏輯組織能力超越了 V3.2,能夠與 Claude Opus 4.6 和 Gemini 3.1相媲美。更令人驚訝的是,DeepSeek 這次V4的測試權限提前給予華為等國內晶片製造商,而沒有開放測試權限給輝達和 AMD。這次的真正關鍵不是 1M token,而在於“誰最先適配晶片”了。01. 顛覆行業這真是顛覆了整個行業的慣例。此前,無論是 OpenAI 還是 Google,在發佈之前都會先與輝達共享預發佈版本進行適配最佳化。而這一次,DeepSeek V4版本直接跳過了這一過程,使得華為昇騰等國產晶片提前獲得了幾周適配最佳化的機會。據稱,提前適配可以使模型性能提高超過 30%。這可以被視為一個重要訊號。在過去三年裡,美國對算力的封鎖策略非常明確:限制GPU的出口,使得中國的人工智慧無法取得突破。A100、H100都不允許出售,即使是削減版的H800也要受到管控。然而,DeepSeek去年通過R1證明了以低成本同樣能夠訓練出世界級的模型,這導致輝達單日市值蒸發近6000億美元。02. 美國市場為什麼緊張?如果DeepSeek V4與華為的組合效果良好,意味著我們不僅能成功訓練模型,還能夠在不依賴於你GPU的晶片的情況下運作。非常巧合的是,前天輝達的股價下跌了 5.5%。儘管主要原因是財報發佈後投資者的預期過高,導致的不滿,但 DeepSeek 跳過輝達並選擇華為的舉動,顯然也對市場情緒產生了影響。據多個消息源透露,DeepSeek  V4 將在一周內上線,目前至少有一家推理服務商已經簽署了保密協議,獲得了測試權限。等發佈後我們會第一時間進行實測~03. DeepSeek  V4功能劇透同時,DeepSeek V4 Lite的一張對比圖在國外引起了廣泛關注!與現有的Deepseek V3.2思考模型相比,DeepSeek V4 Lite在不開啟思考模式的情況下,生成的SVG影像品質顯著提升。如果 DeepSeek  V4 確實能夠在百萬 token 的上下文中穩定進行倉庫級的推理,這意味著你可以將整個程式碼倉庫或《三體》三部曲這樣的書籍全部放進去讓它一次性理解。同時,保持 DeepSeek 一貫的低價(傳聞比 GPT-4.5 便宜 20 至 50 倍,且是 MIT 開放原始碼的),這對於所有使用 AI 進行Vibe Coding 程式設計的朋友們來說都是個好消息。寫在最後:DeepSeek這次V4版本優先測試權限給華為等國內晶片廠商,沒給 NVIDIA 和 AMD 測試權限。這意味著什麼訊號?AI大模型公司提早探索改善算力依賴的結構,而不是一直停留在輝達NVIDIA 生態系中。 (AI共生紀)
春節AI大戰退潮,Claude被封殺Anthropic「單挑」中美,全民養「龍蝦」|Hunt Good 周報
所有人都在等 DeepSeek,春節來,下周來,還是沒來。從免費安裝 DeepSeek,到現在是付費安裝 OpenClaw一場為了全面「狙擊」 DeepSeek,搶奪流量,但是 DeepSeek 都沒出現的春節大戰,就在一輪又一輪的紅包奶茶裡轟轟烈烈地結束了。根據《晚點》的春節 AI 全記錄報導,阿里的千問砸了 30 億,冠名四家衛視春晚,讓 1.3 億人用 AI 搶到了免費的奶茶和機票,甚至一度讓系統崩潰、外賣訂單限流。騰訊的元寶狂擲 10 億發紅包,試圖重現 2015 年微信紅包的社交裂變奇蹟。字節的豆包則霸佔了央視春晚,除夕夜單日互動量飆到恐怖的 19 億次……喧囂過後,留給大廠的卻是一個極其現實的「節後綜合徵」。用真金白銀砸出來的上億日活,在打卡任務結束後,迅速迎來了不可避免的回落。圖片來源:月狐資料都想要成為未來的終局之王,但它絕不會是那個在春晚上發錢最多的 App。大概只有那個像現在的 OpenClaw 一樣,不斷進化,讓我們在某天清晨突然驚覺,「我已經好幾個月沒有自己動手做過這件事了」的殺手級產品,才能獲得最後的勝利。於是乎,在廣袤的工作流配置、電腦桌面和生活交易中,新的戰爭又開始了。這期 Hunt Good 周報,APPSO 帶你穿透春節的喧囂,理清春節假期到這周來,海內外的 AI 行業,又發生了怎樣的變化。春節 AI 大戰結束,相關資料顯示一眾大廠行銷耗資累計超百億,復盤拉新和留存,模型成了最有話語權的代表。Anthropic 熱搜不斷,先是衝擊軟體股,然後挑起蒸餾風波,再是和五角大樓的對抗。AI 軟體產品形態都在「龍蝦化」,阿里開源 CoPaw,Kimi 和 MiniMax 相繼推出 Kimi Claw、MaxClaw,主打一鍵部署龍蝦。「樸素的」國內春節 AI 大戰,發紅包、送奶茶這大概是一場前所未有的「全民 AI 掃盲運動」。一邊是瘋狂的撒錢,一邊是春節過後回覆正常的水平,這場賽博春節後的冰與火,形成了一個逃不掉的問題,留存之困。巨頭們都很清楚,用紅包堆起來的日活,就像沙灘上的城堡。騰訊元寶在除夕夜 DAU 沖上 5000 萬的高光時刻,很快面臨著流量回落的陣痛。元寶試圖用「元寶派」打造一個 AI 陪人玩的社交空間,甚至被微信接連封禁了分享連結。但殘酷的現實是,如果使用者不知道為什麼要用 AI,拉再多群也留不住人。阿里千問用「25 元買一個新使用者」的代價,強行培養使用者「用 AI 點奶茶」的習慣。這確實比純聊天更進了一步,但它依然依賴於阿里的電商生態輸血。大家都殊途同歸地發現了一個真相:打江山易,守江山難。1 億日活的背後,是每天幾千萬元的驚人推理成本。如果 AI 僅僅是一個「陪聊工具」或「高級搜尋引擎」,它根本無法支撐起如此龐大的算力開銷。留存的終極解法或許還是得看最後的產品,好的模型、好的產品。🤺 最好的行銷,是單純的燒錢?我們在春節前的周報裡曾寫到,當時佔據 App Store 排行榜的前三名,剛好就是豆包、元寶和千問,DeepSeek 排在第七名。一輪春節大戰下來,豆包和千問還在前三,但是元寶已經來到了第九名。大概元寶本也想著 DeepSeek 能更新的話,它還能和 2025 年春節一樣,再弄一個 DeepSeek 滿血版,拉來一波新使用者。現實很殘酷,在《晚點》的報導裡提到,一位騰訊的工作人員說,「我們很清楚,春節過後,那些沖高的日活會開始逐漸下降」,他們不指望一場春晚、一個春節就能讓產品發生質變,但「防守總好過完全放棄」。在這場春節 AI 大戰中,騰訊率先啟動了「分 10 億」類現金紅包活動,通過現金紅包 + 社交裂變,像元寶派等進行節前預熱和行銷。緊接著是阿里開啟千問「請客計畫」,以免單形式聯動阿里旗下多項業務。有第三方機構估算和媒體復盤,提到此次的請客計畫,30 億元起步、後續被估算加碼到 60 億元。字節則是拿下春晚冠名,利用春晚節點聯動和內容生成互動(頭像、祝福等),在春晚播放期間,也送出了大量紅包和 10 萬份科技好禮。螞蟻阿福,在春節期間也開啟了新使用者得無門檻 16.8 元紅包活動。百度文心也在春節期間,發出了 5 億紅包……就這麼把白花花的銀子花出去了,也成功激起了一些水花。根據 QuestMobile 和各 AI 廠商官方的統計資料,在這場撒錢大戰,千問「一句話下單」近 2 億次,DAU 日活峰值 7352 萬、增幅達到 940%。字節的豆包,在除夕當晚,產生了 AI 互動 19 億、生成頭像 5000 萬張、祝福 1 億條。元寶的 DAU 也超過 5000 萬,MAU 月活來到了 1.14 億……儘管春節期間這些資料暴漲,但整個 AI 行業還是普遍面臨「補貼退潮後使用者留存」的難題。例如在春節期間,豆包的日活躍使用者最高來到了 1.4 億,千問和元寶分別有 5000 萬和 4000 萬;但在春節假期結束的前一天,元寶幾乎是回到春節活動之前的日活規模,千問和豆包有明顯提升,但與春節期間的高峰對比,仍差距較大。(詳見上圖 3)無論是點了一杯免費的奶茶、領了一個無門檻的紅包就解除安裝,還是真實地開始用豆包/千問/元寶,這個春節顯然是把大量使用者第一次帶進了 AI 對話方塊裡。當補貼退潮,面對一個空白的 AI 對話方塊,又有多少普通人知道該聊些什麼?🎯 紅包留不住使用者,一個好用的模型可以雖然阿里、騰訊、MiniMax、智譜都有在春節 AI 大戰這期間發佈產品,但最後都沒能敵過字節的 Seedance 2.0,說它是今年的「DeepSeek」一點都不為過。阿里在除夕當天正式發佈 Qwen3.5,並推出 Qwen3.5 系列的第一款模型 Qwen3.5-397B-A17B 的開放權重版本,Qwen3.5-Plus 為該模型的 API 版本。Qwen3.5-Plus 採用混合架構,總參數量雖達 3970 億,但啟動參數僅為 170 億。此外,Qwen3.5-Plus 實現了從純文字到原生多模態的升級。模型基於視覺和文字混合 Token 進行預訓練,還新增了大量 STEM 和推理資料,登頂多個開源模型榜單。智譜 GLM-5 生成的 Word 文件智譜在春節假期前兩天,也正式發佈了 GLM-5,並且開源。GLM-5 採用 MoE 架構,總參數量達 744B,但啟動參數僅為 40B。核心性能方面,GLM-5 展現了較強的 Coding 與 Agent 能力,開源 SOTA 表現已無限逼近 Claude Opus 4.5。而就在這天,MiniMax 也正式上線了最新旗艦程式設計模型 MiniMax M2.5,M2.5 最大的突破在於打破了高昂的算力成本限制,MiniMax 宣稱這是首個「不需要考慮使用成本」的前沿模型,直接對標 Claude Opus 4.6。但這些發佈,都沒能搶走這一整個春節 AI 大戰裡,Seedance 2.0 的風頭。字節在假期前兩天正式發佈了新一代視訊創作模型 Seedance 2.0,採用了統一的多模態音視訊聯合生成架構,核心突破在於允許使用者同時輸入多達 9 張圖片、3 段視訊、3 段音訊以及自然語言指令。Seedance 2.0 的生成質量和物理精準度均大幅提升,徹底點燃了海內外社交媒體。在 X 上,一大波老外發帖在問怎麼註冊即夢,怎麼接收 +86 的手機簡訊驗證碼。緊接著,字節在 13 號發佈了 Seedream 5.0 Lite 統一編輯與生成的圖像創作模型,14 號發佈通用大語言模型 Seed 2.0。Seed 2.0 顯著強化了多模態理解與指令遵循能力,針對大規模生產環境下的使用需求做了系統性最佳化。國外 Anthropic 霸榜熱搜,馬斯克、奧特曼頻繁發聲矽谷沒有紅包大戰,但 Anthropic 卻憑藉硬核的「產品力」,直接霸榜了科技圈的熱搜。前腳 Anthropic 指出多家國產 AI 「蒸餾」Claude 模型的回答,後腳馬斯克就在 X 上回覆,你 Anthropic 到處偷資料,蒸餾了人類的資料,還好意思叫自己 Anthropic。之前馬斯克就在 X 上,給這些 AI 大廠的名字來了一波新的解釋,說 OpenAI 是 CloseAI、Stability 是不穩定,所以 Anthropic 也不是人類學,是厭世。這次,馬斯克也是連發多條 X 反駁 Anthropic,再次說他們是 MisAnthropic。「蒸餾」的控訴告一段落,Anthropic 和美國五角大樓的矛盾又沸沸揚揚。奧特曼、Ilya 都在 X 發文支援 Anthropic 堅持 AI 模型使用必須有邊界的觀點。但尷尬的是,奧特曼前腳才說支援 Anthropic 的反對,馬上就又發文和五角大樓達成合作。在紛紛擾擾的輿論場之外,Anthropic 也更新了 Claude Code 的遠端控制功能,以及 Claude Cowork 的定時任務、多個企業高效外掛等。🥅 「AI 的使用必須要有邊界」這次的矛盾主要在於 AI 的應用邊界。Anthropic 在去年就曾獲得五角大樓一份價值 2 億美元的合同,其模型 Claude 甚至獲得了處理機密資料的安全許可。然而,雙方關係在近期急劇惡化。主要原因就是在這份合同裡,Anthropic 堅決拒絕修改使用條款,明確禁止 Claude 被用於「任何合法目的」。Anthropic CEO 在接受採訪時表示,除非軍方解決公司對 AI 濫用的擔憂,否則他們絕不會在其設定的「紅線」上退讓。整個矽谷對這件事議論紛紛,Google的一百多名員工本周簽署請願書,呼籲公司拒絕配合五角大樓的部分 AI 無限制使用;來自亞馬遜、微軟和Google的員工也聯名發表公開信,敦促領導層在面對五角大樓時守住 AI 底線。Anthropic 之所以敢硬剛,底氣或許源於其並不依賴這份訂單。雙方爭執的合同價值約 2 億美元,而 Anthropic 去年的年化營收已達到 80 億至 100 億美元。有意思的是,這件事裡 OpenAI 的操作成為了最耐人尋味的轉折點。雖然奧特曼也曾公開聲援 Anthropic,在內部備忘錄中表示「儘管有分歧,但我信任他們,他們真心關心安全」,也重申了 AI 不應被用於致命武器等方面的立場。但就在美國政府下令聯邦機構停用 Anthropic 技術的當晚,OpenAI 卻宣佈已與五角大樓達成協議,將為其機密系統提供 AI 支援。OpenAI 聲稱找到了一種方法,能在滿足五角大樓需求的同時植入安全護欄,防止 AI 系統被濫用。前一天,OpenAI 還宣佈完成 1100 億美元新一輪融資,投前估值高達 7300 億美元。具體來看該筆融資:軟銀投 300 億美元、輝達投 300 億美元、亞馬遜投 500 億美元。擁有了該筆融資後的 OpenAI,估值直逼特斯拉。丟了 2 億美元訂單的 Anthropic 也表示這件事沒畫上句號,他們會對五角大樓認定的「供應鏈風險」提起訴訟。⏳ Anthropic「蒸餾」了人類最大的知識庫周二,Anthropic 發文公開指控 DeepSeek、月之暗面(Moonshot AI)和 MiniMax 三家國產 AI 實驗室利用名為「九頭蛇叢集」的分佈式網路,控制約 2.4 萬個虛假帳號,非法獲取 Claude 模型輸出以進行「蒸餾」訓練。據 Anthropic 統計,這些帳號繞過檢測生成了超過 1600 萬次對話,內容涵蓋程式碼生成、複雜任務編排等 Claude 的核心優勢領域。消息一發佈,馬斯克率先站出來表示 Anthropic 有問題。Anthropic 自身曾因大規模抓取盜版書籍,像是建立「巴拿馬」項目掃描全球書籍訓練模型而支付巨額版權和解金。對此,馬斯克是直接嘲諷,「Anthropic 竊取了訓練資料,這是事實。」知名博主 Nathan Lambert 也發表深度分析指出,這件事並不是像 Anthropic 挑起的輿論渲染般嚴重。Lambert 認為,雖然蒸餾(讓弱模型學習強模型輸出)能幫助模型快速「熱身」,但真正頂尖的模型能力,尤其是面對未知問題的推理路徑,還是高度依賴強化學習中的自我探索與試錯,這是單純模仿 API 輸出無法習得的。他強調,中國 AI 公司擁有優秀的基礎設施和人才,其技術突破更多源於紮實的工程創新,而非僅僅依靠 Anthropic 說的「走捷徑」。💥 一場發佈會,上兆美元市值消失,還有人周二,Anthropic 發佈了其企業級產品 Cowork 的重大更新,市場反應卻出乎意料地違背了「軟體末日」的劇本。不同於先前 Claude Cowork 發佈時,直接導致軟體股暴跌,這次發佈後,部分軟體服務公司像 Salesforce 股價反而上漲 4%,Thomson Reuters 大漲 11%,Figma 也上漲了 10%。這種略顯反常的現象,或許還標誌著市場邏輯的微妙轉變。投資者開始意識到,新一代 AI 工具的定位,不是替代「軟體」,而是替代操作軟體的「員工」。Claude Cowork 這次更新的核心,在於將 Cowork 轉化為能深入企業各部門的專業智能體,並推出了 10 個針對 HR、設計、工程、金融等具體場景的外掛範本。與 OpenAI 此前宣稱 AI 將取代 Salesforce 等軟體的激進態度不同,Anthropic 選擇了與現有 SaaS 巨頭深度整合的合作,大多數外掛能深度連接 Google Workspace、Slack、Salesforce 等主流應用。這意味著企業仍需為基礎軟體付費,AI 只是接管了原本由初級員工完成的點選和輸入工作。例如,這次新增的金融系外掛,已經能覆蓋從財務建模到推介材料生成的全鏈條,而這也正是初級分析師的核心工作。當 AI 逐漸接手基礎執行工作,這種軟體公司的緩衝期可能是打工人的陣痛期。🔗 相關閱讀:4900 萬人圍觀的 Claude Cowork 又殺瘋了,10 個頂級外掛上線,這些打工人危Agent 之後「Claw」成為新的 AI 產品風向標無論是春節大戰裡,千問的「一句話點奶茶」,還是國外 Claude Code 能力太強引起的系列衝突,都說明著 AI 開始長出手腳,從一個聊天框,變成能真正辦事的產品。就連曾經 AI 產品的頂流 Cursor,現在除了程式設計師朋友,一般關注 AI 的玩家好像都很少提到這個應用。因為真正長出手腳的工具,在幾個月的時間,變成了 OpenClaw。這只龍蝦一躍而上,成了全新的 AI 應用最佳實踐。相關 AI 的產品潮流,都離不開「龍蝦」這個概念。Cursor CEO Micheal Truell 前幾天在 X 發文,提到我們來到了 AI 應用開發的第三個時代。第一時代是 Tab 鍵程式碼補全,第二時代是人類引導的同步 AI Agent(一問一答),而第三時代則是能獨立在雲端虛擬機器長時間運行、自主解決複雜問題並提交最終製品的「雲端自主 Agent」。他說,目前在 Cursor 內部 35% 的 PR(程式碼合併請求)已由這類 Agent 獨立完成。換句容易引起 AI 焦慮的話來說,就是「如果你現在還在靠狂按 Tab 鍵來讓 AI 補全程式碼,那你可能已經落後於時代了。」知名 AI 大神 Andrej Karpathy 也轉發了這篇文章,他提到AI 程式設計正在進化,從無 AI -> Tab 補全 -> Agent 代理 -> 平行 Agent -> Agent 團隊這一路線的轉變。針對這種工具的焦慮,他也分享了自己的「二八理論」,花 80% 的時間在你感到舒適、且確實有效的工作流中完成工作;留 20% 的時間去探索下一步可能的方向,即使它目前還行不通。從春節開始到現在,相關的 AI 工具確實一直在更新。有人說 OpenClaw 就是一個 Claude Code,也有人部署了 OpenClaw 真實地提升了工作效率。但無論如何,能在 GitHub 上一個月的時間裡面突破將近 24 萬 Stars,和在社交媒體上的廣泛討論,足以證明這是一個現象級的產品。Claude Code 看到龍蝦的爆火,尤其是這只龍蝦被 OpenAI 「收編」後,也接連推出了一系列最佳化功能,例如能讓我們在手機上就操作 Claude Code,以及推出了面向企業團隊的 10 個頂級外掛。國內廠商也馬不停蹄的更新對 OpenClaw 的支援和適配,在春節前,各大雲服務提供商還只是說,「我們的雲服務開源一鍵部署龍蝦」,到現在是「我們正式推出了自己的龍蝦。」🐾 CoPaw:阿里版 OpenClaw,釘釘、飛書、iMessage 都能連接昨天,阿里通義實驗室在 X 官方帳號發文宣佈,其開發的個人 AI 夥伴引擎 CoPaw 正式開源。和 OpenClaw 主打的超級個人助理一樣,阿里推出的 CoPaw 同樣是一個可以部署在本地或雲端的「協同個人智能體工作台」(Co Personal Agent Workstation)。CoPaw 最吸引人的特點在於其可視化的 UI 友好互動,以及強大的連接能力。它支援接入釘釘、飛書、QQ、Discord 以及 iMessage 等主流即時通訊軟體。我們無需切換應用,在最常用的聊天窗口就可以與 AI 互動。在功能應用上,CoPaw 展現了極高的可擴展性。通過內建的定時任務和自訂 Skills,它既能每日自動抓取小紅書、Reddit 的熱帖或 B 站、YouTube 的新視訊生成摘要,節省我們的瀏覽時間;也能協助整理郵件、管理本地檔案,甚至作為內容創作的輔助工具,從選題到素材蒐集提供全流程支援。向左滑動查看更多內容,CoPaw 本地控制台|圖片來源:CoPaw 官網值得一提的是,CoPaw 在技術架構上主打「本地優先」與「終極模型自由」。它原生支援 Ollama、llama.cpp 以及蘋果晶片的 MLX 框架;模組化的「樂高式」架構讓我們可以像搭積木一樣輕鬆加入自訂模型提供商,或私有 API 端點,以及接入 MCP 等。阿里的官方路線圖顯示,未來 CoPaw 還將解鎖語音和視訊支援,不再侷限於鍵盤互動。🦞 MaxClaw:一鍵雲端部署的龍蝦和阿里的 CoPaw 主打開源、主打本地不同,MiniMax 推出的 MaxClaw 是為瞭解決繁瑣的本地部署,直接讓我們一鍵部署 OpenClaw 在它們的伺服器上。前幾天,MiniMax 升級了自家的 Agent 平台,帶來了 Experts 社區和一個名為 MaxClaw 的新模式。簡單來說,它做的事情,就是把原本需要極客才能部署的 OpenClaw,變成了「一鍵安裝」的傻瓜包。MaxClaw 也打通了 OpenClaw 生態,允許使用者將 AI 接入飛書、釘釘、Telegram 等即時通訊軟體。並且,我們不僅不需要承擔額外的 API 費用,還能直接呼叫 MiniMax Agent 內預置的專家智能體,在 IM 軟體中執行複雜任務。例如要求 AI 自動抓取新聞並整理成早報傳送到飛書對話方塊。雖然不需要自己專門配置 API,但也需要購買 MiniMax Agent 推出的最低 39 元/月的會員訂閱服務。🤖 Kimi Claw:率先引爆國產版龍蝦大戰OpenClaw 當時爆火之後,Kimi K2.5 的模型呼叫量在 OpneRouter 上直接超過了 Gemini 3 Flash、Claude Sonnet 4.5 等海外頂尖模型,登頂 AI 智能體類別的榜首。就在春節,Kimi 自己也緊鑼密鼓的推出了 Kimi Claw。和 MaxClaw 一樣,Kimi Claw 主打的也是一鍵部署,幾秒鐘就能在 Kimi 的伺服器上雲端部署一個 7x24h 的個人 AI 助手。雖然不需要硬體,也不需要配置 API,要想直接在 Kimi 上一鍵養龍蝦,也是一樣有門檻的,我們需要訂閱 199 元/月起的 Allegretto 高級套餐,才能在 Kimi 的網頁上建立。Kimi Claw 的核心在於它強大的擴展能力與儲存空間。它內建了 ClawHub 技能庫,包含超過 5000 個社區貢獻的技能,我們可以通過無程式碼的方式,直接呼叫和編排這些工具。對於資料密集型任務,Kimi 也大方地提供了 40GB 的專用雲端儲存空間。這不僅打破了傳統對話介面的上下文限制,還讓我們能夠上傳大型資料集和程式碼庫,更好地提高工作效率。💻 Claude CoWork:職場外掛全家桶和遠端控制全端上來Anthropic 在這周二宣佈為 Claude Cowork(Claude 的桌面協作功能)推出一系列預建構外掛,讓 AI 能夠深度介入金融、HR、營運等專業領域的工作流程。這些新外掛通過與全球大型企業合作開發,本質上將 Claude 轉變為具備特定工具和指導能力的「智能體」,它不再只是一個聊天框,而是能夠像人類員工一樣在電腦上建立檔案、處理資料並操作應用程式。此次更新的外掛覆蓋了企業運作的核心環節。在金融端,新外掛支援從市場研究、投行交易檔案審查,到財富管理資產再平衡等一系列複雜任務。在 HR 和營運方面,它能生成從 Offer 到供應商提案摘要的各類文件;甚至還能與 Figma 聯動生成設計簡報。周三,Anthropic 又為 Claude Code 增加了一項名為「Remote Control」的新功能。這項工具允許使用者通過智慧型手機、平板電腦或瀏覽器,直接遠端控制本地電腦上的 Claude Code 命令列介面。這和 OpenClaw 部署 Telegram 聊天機器人的想法幾乎是一樣的,我們只需要確保電腦上,即本地的 Claude Code 終端一直處於開啟狀態,就能使用遠端對話,讓 AI 持續給我們幹活。更新還沒停止,周四,Claude  又給 Cowork 增加了定時任務的功能。Claude 彷彿在說,OpenClaw 的功能我也全部都要有。 (APPSO)
儲存巨頭發聲漲價貫穿全年、Deepseek聯合清北發佈論文、OpenAI拿到7500億融資、AI去年對美國GDP貢獻幾乎為零| 算力產業半月報(第44期)
儲存巨頭最新發聲:今年無法滿足所有客戶的需求漲價將貫穿全年!近日,SK海力士在高盛的電話會上發佈對儲存行業及公司經營的最新觀點。該公司認為:“全球儲存器產業已徹底轉向賣方市場,2026年價格漲勢將貫穿全年。”SK海力士這項判斷是基於AI需求爆發與供應端剛性約束的雙重擠壓。公司透露目前DRAM及NAND庫存僅剩約4周,且沒有任何客戶能完全滿足需求。更為嚴峻的是,2026年高頻寬儲存器 (HBM) 產能已提前售罄,標準型DRAM的極度短缺正大幅提升供應商議價權,產業鏈已啟動長期合約談判以鎖定未來供應。SK海力士將發生上述情況的核心原因歸結為兩點:一是AI大模型、高效能運算對儲存器的真實需求持續井噴,遠超產業預期;二是儲存器晶片製造依賴的無塵室空間擴張緩慢,產能爬坡受限,形成“需求-供給”差距。“今年無法滿足所有客戶的需求,價格持續上漲已成定局。”該公司稱。(來源於:新浪財經)高盛:AI去年對美國GDP貢獻幾乎為零高盛首席經濟學家Jan Hatzius認為,儘管美國公司在人工智慧上投入巨大,但進口晶片和硬體抵消了這些投資在GDP計算中的實際意義,因此對2025年美國GDP增長的貢獻基本為零。部分商業領袖可能也持相同的看法。最近一項針對美國、歐洲和澳大利亞近6000名高管的調查發現,儘管70%的公司都在積極使用人工智慧,但其中約80%的公司表示,人工智慧對就業或生產力沒有產生任何影響。(來源於:格隆匯APP)DeepSeek聯合清北重磅硬核論文:發力智能體底層基建 擊穿Agent推理I/O瓶頸!大模型正在從單輪對話機器人,快速進化為能夠自主規劃、呼叫工具並解決實際問題的Agent。然而,這種轉變在底層算力架構上引發了一場大地震。當大模型在長期的上下文中與環境進行幾十甚至上百輪的互動時,計算的瓶頸從GPU的算力轉為儲存I/O頻寬。由於每次只追加極少的Token,導致KV-Cache命中率極高(通常大於95%),GPU大量的時間被用來等待從外部儲存中讀取海量的歷史KV-Cache資料。為了打破這一僵局,DeepSeek聯合北大、清華研究團隊提出了一種全新的大模型推理系統——DualPath。該系統通過引入“雙路徑KV-Cache載入”機制,巧妙利用了叢集中閒置的網路頻寬,將Agentic大模型負載的離線推理吞吐量提升了最高1.87倍,線上服務吞吐量平均提升了1.96倍。目前,這項研究已在包含多達1152張GPU的叢集上完成了大規模驗證,支援DeepSeek-V3.2 660B等頂級大模型。(來源於:華爾街見聞)五角大樓極限施壓Anthropic 要求周六前解除所有AI安全限制美國五角大樓正向 Anthropic極限施壓,要求在美國時間周五晚前(台北時間周六晚前,2月28日晚前)徹底解除Claude的軍事應用限制。如果 Anthropic 拒絕,五角大樓將考慮動用《國防生產法》(Defense Production Act)強制其修改程式碼,或者直接將其打上「供應鏈風險」的標籤,徹底切斷其與軍方乃至其他聯邦承包商的商業聯絡。會後,Anthropic發佈新版政策。公司正式放棄了「單方面暫停大模型訓練」的安全承諾。在政治與商業的雙重壓力下,AI 安全理想主義最終向現實妥協。(來源於:新智元)剛剛,OpenAI狂攬7500億元 輝達、亞馬遜、軟銀搶投2月28日,OpenAI宣佈拿到1100億美元(約合人民幣7544億元)新融資,其中亞馬遜投500億美元、輝達投300億美元、軟銀投300億美元。這也是全球AI領域迄今規模最大的單筆融資。(來源於:智東西)阿里Qwen3.5-Plus/Qwen3.5-397B-A17B 新模型上線2月16日,阿里在chat.qwen.ai頁面低調上線了Qwen3.5-Plus和Qwen3.5-397B-A17B兩款新模型。Qwen3.5-Plus定位為Qwen3.5系列最新大語言模型,Qwen3.5-397B-A17B定位則是Qwen3.5開源系列旗艦大語言模型。兩款模型均支援文字和多模態任務。(來源於:第一財經)千問將發佈AI眼鏡據悉,阿里千問將在2026年世界移動通訊大會(MWC)上發佈AI眼鏡,並於3月2日開啟線上線下全管道預約。據阿里內部人士透露,除AI眼鏡之外,千問還會在年內陸續發佈AI指環、AI耳機等產品,並面向全球市場發售。(來源於:科創板日報)宇樹科技,發佈新款機器人!2月24日,宇樹科技發佈新款四足機器人Unitree As2,稱其動力性能約為當前主力四足機器人Go2的兩倍。宇樹科技發佈的視訊Demo中,Unitree As2挑戰了多種複雜路況和惡劣天氣,能在河溝、雪地、叢林、亂石路中自由穿行。軟體方面,Unitree As2配備仿生具身大模型,並升級了智能伴隨系統,可以隨著人類方位行進,並根據人類手勢移動、跳起,呈現類似人與寵物狗一樣的互動。(來源於:中國經濟網)Google推出Nano Banana 2圖像AI模型:支援4K解析度輸出 改進中文字元亂碼問題2月27日,Google現已正式推出 Nano Banana 2圖像模型,新版模型基於Gemini 3.1 Flash Image 建構,相比上一代擁有更快的響應速度和更強的理解能力,對使用者提示詞的解析也更加精準。據Google透露,Nano Banana 2 在生成一致性方面有明顯提升,同時修復了此前版本中常見的中文字元亂碼、語義混亂或畫面中出現奇怪偽影等情況。在性能層面,Nano Banana 2 的圖像輸出解析度從 2K 提升至最高 4K,可處理更複雜的提示內容,支援在多張圖片中保持最多 5 個角色形像一致,並能在單張畫面中融合多達 14 個元素。(來源於:IT之家)雷軍:十五五小米將重點攻堅 晶片、AI、作業系統等底層核心技術近日,小米集團董事長兼CEO雷軍表示,小米計畫未來五年重點攻堅晶片、AI、作業系統等底層核心技術,向著成為全球硬核科技公司的目標不斷努力。(來源於:北京日報) (超算百科)
Token出海或迎風口!Kimi+DeepSeek+智譜+MiniMax,籌碼集中概念股出爐
AI大模型服務正面臨嚴峻的算力考驗。進入2026年,人工智慧大模型行業競爭步入白熱化階段。春節前,騰訊元寶、阿里千問、字節跳動豆包等大廠集中發力C端市場,通過各類福利活動掀起使用者“爭奪戰”。春節假期至今,全球大模型賽道融資消息也密集落地,資本熱度持續攀升。然而,伴隨使用者規模與使用頻次的激增,Token(詞元)消耗量顯著增長,大模型服務正面臨嚴峻的算力考驗。春節期間,豆包因春晚高頻互動導致算力承壓,一度暫停視訊通話功能;智譜AI等廠商也因高並行請求採取了API限流等措施。算力供給不足、推理資源緊張,已成為當前大模型規模化落地過程中亟待解決的核心難題。中國國產大模型霸榜OpenRouter自2025年初DeepSeek橫空出世、驚豔全球以來,中國大模型產業快速崛起,憑藉獨特的技術與場景優勢持續霸榜全球。據全球最大的大模型API聚合平台OpenRouter資料顯示,2月平台內前十模型總Token消耗量已突破27兆,國產模型貢獻超過14兆,市場佔比超過50%。其中,MiniMax M2.5以超過5兆的Token消耗位居全球榜首;Kimi K2.5緊隨其後,2月Token總消耗量超過4兆;DeepSeek V3.2、GLM 5分別位列第四、第八位。這些頭部國產大模型,普遍聚焦於程式碼能力與智能體(Agent)自動化任務的能力提升。從春節期間的消耗量來看,2月16日至22日(農曆除夕至正月初六),OpenRouter平台Token消耗量前十的大模型中,中國大模型份額佔比已超60%。其中,MiniMax M2.5、GLM-5 消耗量環比大幅增長,增幅分別達到197%和158%。反觀全球市場,Google、xAI、OpenAI等海外廠商旗下大模型的Token消耗量增速明顯低於國內模型,全球市場份額增長乏力,部分甚至出現負增長。Token消耗量或開啟多年增長模式Token(詞元),即AI處理資訊的最小單位。大模型每生成一個Token,後端的伺服器就得高速運轉,這不僅需要強大的算力,更需要大量的電力。根據業內測算,Token生成的成本結構中,電力及算力的成本佔比超過七成。摩根大通的報告顯示,基於使用者情境的預測,從應用採用的角度出發,Token消耗量或開啟多年增長期。中國的AI推理Token消耗量預計將從2025年的超10千兆增長至2030年的約3900千兆,增幅接近369倍,主要受兩個復合要素推動,一是隨著AI成為搜尋、內容生成、客戶服務和生產力的默認介面,AI在消費者使用者和企業工作負載中的滲透率都在提高;二是用例從對話AI擴展到智能體和多模態輸出(更長的上下文、更多的工具呼叫、更豐富的輸出),即使使用者數量增長放緩,這也會實際增加每個會話的Token。從細分領域來看,隨著時間的推移,推理需求的佔比發生明顯變化。對話AI佔2025年預期Token總消耗量的近一半,預計到2030年逐步下降至高個位數百分比;生活情景AI智能體的份額預計將從2025年的個位數提高至2030年的10%至20%。國產大模型具備電力的算力的雙重優勢對於開發者而言,性價比是硬道理。從國內來看,無論是電力還是算力,都具備顯著的成本優勢,並有望重構AI定價權。從電力來看,國家能源局資料顯示,截至2025年底,中國累計發電裝機容量達38.9億千瓦,同比增長16.1%,發電量佔全球總量的三分之一。中國也成為全球首個全社會用電量突破10兆千瓦時的國家,電力供給充足且成本優勢顯著。AI熱潮之下,美國電價呈現明顯上漲趨勢,進一步凸顯中國電力成本的競爭力。從算力來看,早在2025年10月份,央視網報導,“十四五”時期以來,中國開啟新一輪數字基礎設施大佈局,全國一體化算力網連通東西南北,算力總規模躍居全球第二,不僅為中國數字經濟的成長澆築新的基座,也創造了增長的新機遇。目前,國內多家頭部算力企業已建構起完備的適配體系,在推理環節有效突破海外技術壟斷,伺服器、光模組、散熱等關鍵硬體環節也基本實現自主可控。依託規模化部署、低成本電力供給與演算法持續迭代,國產方案在主流應用場景中的Token生產成本具備明顯優勢。業內普遍認為,國產大模型憑藉更高效的架構設計,逐步降低對高端GPU的剛性依賴;而全球開發者對中國大模型的廣泛選用,進一步拉動國產算力需求呈現爆發式增長。14隻籌碼集中大模型概念股出爐儘管在最近幾個交易日的行情中,算力類股表現有明顯分化,但不可否認的是,算力需求提升是必然趨勢。在以周度進行統計的周期中,國產大模型Token消耗量更是一度超過美國(2026年2月9日至15日),後續優勢持續擴大,多重利多因素的加持下,Token出海有望成為趨勢。證券時報·資料寶根據萬得、同花順等公開資訊梳理,A股市場中屬於智譜、Kimi、DeepSeek及MiniMax主流大模型的概念公司有140余家。從市場表現來看,截至2月27日,這140餘隻概念股今年以來平均漲幅超過13%,傑創智能、藍色游標及中控技術今年以來累計漲幅均超過60%,前2隻個股涉及智譜概念,中控技術則涉及DeepSeek概念。首都線上、金現代、優刻得-W今年以來累計漲幅均超過40%,3家公司均涉及智譜概念。從籌碼變化情況來看,最新股東戶數較2025年年末下降的概念股有14隻,3隻概念股的股東戶數下降幅度超過10%,分別是世紀天鴻、恆為科技及遠光軟體。世紀天鴻最新股東戶數較去年末下降近24%,公司以自身戰略定位和資源稟賦為出發點,結合人工智慧技術已推出了基於大語言模型研發的專注於服務老師的AI智能體“小鴻助教”,並投資了基於人工智慧NLP(自然語言處理)技術、聚焦中小學寫作場景的人工智慧輔助寫作產品“筆神作文”。恆為科技最新股東戶數較去年末下降超過21%。公司2025年2月份表示,其推出的昇騰、DeepSeek一體機分為訓推一體機與推理一體機兩種類型,以“開箱即用+高並行低時延”為核心優勢,覆蓋金融、政務、科研、醫療等眾多垂直行業,助力行業實現智能化升級。遠光軟體最新股東戶數較去年末下降10.6%。目前公司主要接入或適配了智譜、阿里千問、DeepSeek、盤古等大模型。這14隻概念股今年以來平均漲幅超過9%,恆為科技、世紀天鴻、值得買漲幅居前,均超過15%。太極股份、浪潮資訊、宇信科技表現較弱,今年以來股價均呈下跌局面,其中浪潮資訊伺服器市佔率全球領先,涉及DeepSeek及MiniMax概念。(資料寶)
DeepSeek V4逼近,美國慌了!被曝繞過輝達優先中國,絕密參數已洩露
最近,炸裂消息一個接一個。首先,DeepSeek V4將在一周內上線。第二,它跳過輝達,把存取權首先給了某中國晶片廠商。另外,Anthropic因為蒸餾事件,也被群嘲了。炸裂消息:根據多方來源,DeepSeek V4將在一周內上線!現在,DeepSeek V4 Lite至少在一家推理服務商進行測試,目前透露出的資訊有——模型代號為Sealion-lite,有100萬token的上下文窗口,這個模型比網頁版/應用模型好用得多,而且還是原生多模態模型。與此同時,DeepSeek v4 Lite的一張對比圖,也在外網傳瘋了!與目前的Deepseek v3.2思考模型相比,DeepSeek v4 Lite不開啟思考模式,生成的SVG影像品質明顯更好。DeepSeek壓頂,美國慌了!DeepSeek V4春節沒來,但這次不遠了。路透社稱,一些晶片廠商已經接入DeepSeek V4,最佳化性能。消息人士稱,DeepSeek這次向某國產晶片廠商提供了V4的早期接入權限,而不是輝達等美國算力霸主。這直接打破了過去AI模型大版本發佈前的行業慣例。這條消息來自兩位消息人士,路透社表示。而就在昨天,美國官員聲稱DeepSeek使用非法獲得的輝達GPU進行訓練。Anthropic直言DeepSeek等通過蒸餾Claude的回覆來運作,斷言他們缺乏真正的內部創新能力只會抄襲。美國的CNN、CNBC、NYT等大眾和科技媒體紛紛推出相關報導去年,Deepseek發佈後確實有過攻擊,如此密集攻擊前所未有。但也在意料之中。上一次Deepseek發佈模型時,引發了恐慌——去年,DeepSeek-R1發佈或導致輝達股價下跌17%!而現在可能發生什麼?如果DeepSeek V4再次展現出驚人的效率和能力,很可能會重演甚至加劇去年的投資者恐慌,對正在尋求巨額融資的美國AI公司和希望股價穩定的輝達、Google等巨頭構成直接威脅。這不是庸人自擾,即便是競爭對手的研究人員也承認DeepSeek V4不可小視,可能發佈就登頂開源第一!美國的這波輿論攻擊,並非偶然,Reddit使用者總結稱:這是一場有組織的FUD(恐懼、不確定性和懷疑) 行銷:搶佔敘事:在DeepSeek V4發佈前,預先埋下「他們只會作弊/抄襲」的敘事框架。這樣,無論V4多成功,公眾的第一反應都會被引導至負面解讀。保護市場:通過輿論手段稀釋V4發佈的媒體關注度和影響力,試圖穩定投資者情緒,防止股價再次出現兩位數暴跌,為美國本土AI公司的融資和發展爭取時間。維護霸權:從更深層次看,這是為了維護美國在AI領域的技術和敘事霸權,打擊中國AI的崛起勢頭。當你看到這類鋪天蓋地的負面報導時,要特別留意它的發佈時間。將其與即將發生的重大事件(如DeepSeek V4發佈)聯絡起來,思考誰最有可能從這種輿論中受益,以及他們真正在恐懼什麼。不要輕易被這些報導的結論帶著走。要學會看穿表面的FUD,基於事實和歷史證據,去洞察背後真實的技術競爭和市場博弈。Claude自曝「我是DeepSeek」!全網嘩然與此同時,另外一件事,也在全網炸鍋了。X上一個使用者發現,當他向Claude提問「你是什麼模型」時,它竟然回覆:「我是DeepSeek V3,是由DeepSeek公司開發的開源大語言模型。」這一bug,是否說明Claude是基於DeepSeek蒸餾的?諷刺的是,就在不久前,Anthropic剛剛高調指責DeepSeek進行了「工業級蒸餾攻擊」。這一幕,簡直堪稱AI時代的行為藝術。網友stevibe完全復現了Claude Sonnet-4.6的這波操作:不過,有的網友在Claude App中完全無法復現結果。的確有網友在Claude App復現了該問題,但很難一次成功。為了力證這一結果的有效性,他特意通過Anthropic的官方API端點再次測試,結果還是一樣。根據他人提供的創意,這位網友又試著用法語提問「你是什麼模型」?這次,Opus 4.6開始回答:我是ChatGPT。為什麼stevibe能通過API復現結果,為什麼不能用Claude App復現?最大的原因可能是系統提示詞。如果沒有系統提示詞,AI會根據訓練資料回答。有網友推測:這是一個資料污染/身份對齊問題,並不能證明任何事情。如果你用正確的語言進行足夠深入的探究,每個主流模型都會存在這個問題。總之,Anthropic的訓練資料成了不能說的秘密。當然,Claude Sonnet 4.6會自稱「我是DeepSeek」,需要符合以下三個特定條件——清空系統提示、使用中文提問、特定模型版本。事情的關鍵在於:當默認系統提示要求模型自稱Claude 時,一切都很正常;一旦把系統提示清空,模型在中文語境下竟然就開始「認祖歸宗」。問題來了,如果一個模型中沒有系統提示詞約束的情況下,就會產生「我是某某模型」的回答,原因到底是什麼?是訓練資料的統計殘留,還是大模型中多源資料訓練下,出現了自然語言泛化的副作用?目前還無法判斷。但Anthropic似乎被啪啪打臉了:在指責別人蒸餾時,你最好能確保自己不會在刪除提示詞後出現身份錯亂。畢竟,蒸餾在機器學習中,是一種非常常見的技術。Anthropic指責他人進行「工業級蒸餾攻擊」時,聽上去簡直嚴重到像一起網路安全事件。以此站在道德高地上,吃相就有些難看了。模型的身份穩定性,本身就是機率分佈問題。大模型沒有自我認知,只是在生成統計上最合理的答案。如果在中文資料分佈中,「我是DeepSeek」這種模式機率較高,那麼在沒有系統提示的情況下,模型就可能走向那條高機率路徑。網友Theo Borges解釋了其中的原理:一切都是機率和零系統提示詞這不一定說明「蒸餾發生了」,但它說明——模型的語言空間是共享的。當整個行業都在同一個語料海洋中訓練、最佳化、蒸餾時,邊界本身就變得模糊。群眾的眼睛是雪亮的,Anthropic的thread,已經被網友們的吐槽沖了。6000多條評論,70%都在吐槽Anthropic這套又當又立的行事邏輯,直接讓Anthropic的風評跌至歷史最低點。接下來,我們看DeepSeek的了。 (新智元)
算力用Blackwell,資料靠Anthropic?DeepSeek新模型發佈前遭美圍堵
2026年2月底,全球AI行業正屏息以待中國AI獨角獸DeepSeek即將發佈的新一代旗艦模型(外界普遍預計為V4)。然而,就在新模型即將亮相的前夕,華盛頓和矽谷接連投下兩枚重磅炸彈:美國政府高官指控DeepSeek涉嫌使用被禁運的輝達Blackwell晶片進行訓練,而美國AI巨頭Anthropic則公開指責DeepSeek等中國企業對其進行了“工業級”的資料蒸餾。這一“硬體涉嫌違規獲取、資料涉嫌違規蒸餾”的雙重爭議,不僅讓DeepSeek的新模型未發先火,更將中美在人工智慧領域的科技博弈與生態競爭推向了新的高潮。一、 算力之謎:內蒙古資料中心裡的Blackwell晶片?在算力層面,DeepSeek一向以“極致的工程最佳化”和“在算力受限下實現性能突破”聞名。但據路透社在2026年2月23日的報導,一位川普政府的高級官員透露,DeepSeek即將在下周發佈的新模型,實際上是使用輝達目前最先進、性能最強悍的Blackwell架構晶片訓練而成的。這一指控如果屬實,將直接觸碰美國的出口管制紅線。目前,美國政府嚴禁將Blackwell晶片出口至中國。暗渡陳倉的算力叢集? 美方情報宣稱,這批Blackwell晶片被集中部署在DeepSeek位於內蒙古的龐大計算中心內。至於這些尖端晶片是如何繞過層層封鎖流入中國的,美方並未透露具體細節,但外界猜測可能涉及複雜的跨國空殼公司網路或走私管道。報導進一步指出,美國政府確信DeepSeek在發佈新模型時,會通過技術手段刻意抹除底層硬體的技術特徵,以防止外界從模型結構和輸出中反推出其使用了美國尖端AI晶片的證據。面對這一指控,輝達拒絕置評,而中國駐美大使館則發表聲明予以反駁,堅決反對美方“劃定意識形態界線、泛化國家安全概念、濫用出口管制”。二、 資料之爭:Anthropic的“工業級蒸餾”指控如果說晶片指控是來自美國政府的“硬體圍堵”,那麼資料蒸餾的指控則是來自美國AI同行的“軟體反擊”。就在美政府高官放風的同一天,Claude大模型的開發商、AI巨頭Anthropic在官方部落格中發佈了一項震動業界的指控。Anthropic稱,包括DeepSeek、月之暗面(Moonshot)和稀宇科技(MiniMax)在內的三家中國“AI小老虎”,正利用大量虛假帳戶對Claude發起**“工業級蒸餾攻擊”(Industrial-scale distillation attacks)。Anthropic聲稱,這些企業累計註冊了超過2.4萬個虛假帳戶,與Claude模型進行了高達1600萬次的高頻互動。蒸餾技術(Distillation)是指利用一個成熟、龐大且能力強悍的“教師模型”,來生成高品質的邏輯推理資料,從而訓練一個參數更小、成本更低的“學生模型”。通過這種方式,後發者可以大幅壓縮試錯時間和研發成本,實現“彎道超車”。事實上,不僅是Anthropic,OpenAI和埃隆·馬斯克旗下的xAI近期也頻繁發出類似警告,指責競爭對手在“吸血”美國頂尖模型的推理能力。不過,這一指控在網際網路上也引發了不小的爭議。許多開發者諷刺稱,Anthropic和OpenAI在發展初期同樣是靠無差別抓取全網資料甚至競爭對手的資料起家的,如今卻指責別人“蒸餾”不道德,頗有“雙重標準”的意味。三、 華盛頓的政策撕裂與產業震盪DeepSeek這一系列風波的背後,暴露出了華盛頓在對華科技戰中的深度糾結與政策撕裂。在2025年底,川普總統曾一度批准對華出售上一代H200晶片(附加25%關稅),但對最先進的Blackwell依然保持絕對封鎖。如今“DeepSeek涉嫌使用Blackwell”的消息傳出後,美國內部爆發了激烈的路線之爭:強硬派(對華鷹派): 認為這證明了出口管制漏洞百出。他們主張,既然中國企業能搞到Blackwell並可能用於具有潛在軍事用途的AI開發,美國就必須全面切斷任何等級AI晶片(包括H200)的對華出口,甚至加大對半導體裝置的制裁力度。務實派(如白宮AI負責人David Sacks與輝達CEO黃仁勳): 則持相反觀點。他們認為,一味地死封硬堵反而會倒逼中國企業加速採用華為(昇騰)等國產晶片,最終讓美國半導體巨頭失去全球最大的市場和技術主導權。四、 創新還是捷徑?等待新模型的最終檢驗儘管DeepSeek目前對上述兩項指控保持沉默,但這些爭議無法掩蓋一個事實:DeepSeek在AI底層架構上的創新能力是不可忽視的。無論是此前震驚業界的R1模型,還是其在近期論文中公佈的mHC(流形約束超連接)和Engram(條件記憶)等旨在解決訓練穩定性和視訊記憶體效率的前沿架構,都證明了其擁有一支世界頂級的演算法團隊。即使真的使用了Blackwell算力和Claude的蒸餾資料,如果缺乏卓越的演算法工程能力,也無法將這些資源轉化為驚豔的模型表現。預計DeepSeek的新一代模型就將正式揭開面紗。屆時,這款模型能否在多項基準測試中再次拉平甚至超越美國的頂尖模型,將成為全球科技界矚目的焦點。無論它的成功是源自非凡的演算法創新,還是如美方所指責的“違規硬體與資料捷徑”,DeepSeek的新模型都註定將成為2026年AI歷史上最具爭議、也最具標誌性的里程碑事件。它不僅是一次技術的發佈,更是中美兩大科技陣營在算力封鎖、資料爭奪和開源規則制定上的一次正面交鋒。 (壹號講獅)
三家中國大模型公司被捲入蒸餾風波,律師解讀:Anthropic的指控從法律上很牽強
既沒有駭客入侵,也沒有竊取OpenAI或Anthropic內部的核心參數、底層程式碼或演算法邏輯。將這種公開獲取資料的行為認定為不正當手段,在法律上非常牽強。近日,美國AI初創公司Anthropic突然向中國大模型企業發難,指控包括DeepSeek等在內的三家中國企業,通過約24000個帳戶與其旗下模型Claude進行了超過1600萬次互動,涉嫌通過蒸餾技術竊取Claude的功能以改進自身模型。這一指控在社交網路上引發軒然大波,甚至引來首富埃隆·馬斯克的辛辣嘲諷“他們竟敢‘偷竊’Anthropic從人類程式設計師那裡偷走的東西?”這一新聞事件極具戲劇性與諷刺性,作為專業人士,我們不妨適當剝離情緒化的爭論,從法律視角探討資料蒸餾的法律風險,審視Anthropic本次指控的法理困境及矛盾,探尋其隱藏在“正當維權”大旗下的真實目的。01大模型蒸餾的法律問題在探討法律適用之前,我們必須先釐清技術事實。所謂蒸餾(Distillation),通俗來講,就是用一個已經訓練好的、能力強大的大模型(又稱“教師模型”,如GPT-5或Gemini 3.1)的輸出結果,作為教材來訓練一個體積更小、但效率更高的小模型(又稱“學生模型”)。這種方法能夠以極低的成本和極短的時間,讓小模型獲得接近大模型的能力。正如網路梗圖所言,“不要問女人的年齡,不要問男人的薪水,不要問AI公司的訓練資料從那裡來。”在當前的人工智慧行業,蒸餾或者說利用他方模型的輸出進行二次微調,幾乎是行業內公開的秘密與常規操作。學術界普遍認為,蒸餾本身並無天然的違法性,大家相互借鑑經驗,對於不公佈程式碼的閉源模型而言,通過指令微調來學習其黑盒經驗是一種正常的技術迭代手段。從智慧財產權角度來看,這種行為不可避免地觸及多項法律權利。首先,在著作權法層面,如果教師模型的輸出內容被視為受保護的作品,那麼學生模型對其進行的大規模抓取和分析,理論上可能會引發關於資料複製或改編的合規性疑問。其次是商業秘密層面的考量。教師模型的演算法邏輯與機率分佈若被視為核心機密,通過API呼叫進行規律推導的行為,將涉嫌對商業秘密的刺探。最後,在反不正當競爭與合同合規方面,利用大量帳戶規避區域限制並提取知識,涉嫌違反平台服務條款,也可能存在有違商業倫理的搭便車嫌疑。這些理論風險,構成了Anthropic等西方科技巨頭向後來者發難的法理外衣。02AI生成內容的維權困境儘管上述理論風險客觀存在,但結合現行的智慧財產權原則與行業實踐來看,將蒸餾行為直接等同於著作權侵權,在邏輯上可能面臨很多挑戰。其一,人工智慧生成內容的權利歸屬通常較為複雜。根據中美兩國的著作權法及近年的司法實踐,構成作品的核心要件是人類的智力創造。美國版權局在此前多起涉及AI生成圖片的註冊申請中,均明確拒絕了對純AI生成內容給予版權保護;中國北京網際網路法院在“AI文生圖第一案”中雖然認定特定情況下AI生成圖片具有可版權性,但其前提是人類使用者在提示詞輸入上付出了極其顯著的智力勞動,最近的其他法院對該等標準也把握較為嚴格。中國大模型企業通過API或網頁呼叫Claude產生的資料,本質上是機器演算法的機率性輸出。Anthropic作為模型的開發者,並沒有對這些具體輸出內容進行直接的人類智力干預。既然這些輸出結果缺乏人類作者身份,它們就無法達到可版權性的標準,大機率屬於公共領域的產物。既然部分模型輸出的內容未必構成法定作品,平台方基於此主張版權受損的阻力便會增大。其二,行業內普遍存在的使用者協議條款也可能限制了平台方的維權空間。許多大模型服務商(包括業內頭部的OpenAI等)在其使用者協議中通常會約定,平台不對使用者的輸入主張所有權,且將模型輸出內容的權益轉移給使用者。目前,Anthropic在消費者服務協議(Consumer Terms of Service)中明確載明,在雙方之間,使用者擁有所有輸入(Prompts)和輸出(Outputs)的內容。Anthropic特此將輸出內容的所有權利、所有權和利益(如果有的話)轉讓使用者。在這種行業規則下,使用者獲得了對輸出內容的支配權,平台若再以智慧財產權為由限制使用者對輸出結果的使用(包括用於訓練新模型),在法理上可能存在爭議。其三,基於思想與表達二分法原則,版權通常只保護對思想的具體表達,而不保護思想、方法或概念本身。在知識蒸餾中,學生模型學習的軟標籤、演算法規律與推理鏈條,更傾向於認知系統的建構原理,屬於不受保護的思想範疇 。蒸餾行為更像是在拜師學習,而非抄襲。同時,為了提取資料特徵而產生的臨時性資料處理,通常旨在挖掘規律,這在很大程度上契合了促進技術發展的轉換性使用原則,或許多國家設立的文字與資料探勘合理使用例外。03商業秘密及不正當競爭侵權分析在商業秘密和不正當競爭的維度上,知識蒸餾的合理性同樣值得探討。商業秘密的保護前提是資訊具有一定的秘密性。但API介面和網頁對話方塊是平台向大眾公開的,第三方通過公開的介面合法輸入提示詞並獲取輸出,既沒有駭客入侵,也沒有竊取OpenAI或Anthropic內部的核心參數、底層程式碼或演算法邏輯。將這種公開獲取資料的行為認定為不正當手段,在法律上非常牽強。搭便車和不正當競爭的指控,是Anthropic最可能發力的法律維度。我們必須認識到,反不正當競爭法的核心價值在於保護公平自由的市場競爭秩序,而非保護某一個特定競爭者的既得利益。在競爭法視野中,搭便車行為並非一律違法,模仿本身是技術創新的必經階段。判斷某項模仿行為是否構成不正當競爭的關鍵,在於模仿者是否通過創造性的勞動帶來了重大的技術增量,並在客觀上拓展了公眾的選擇空間。以被捲入此次風波的DeepSeek為例,其模型的成功絕非對先進模型的簡單同質化復刻或不勞而獲。公開資料顯示,DeepSeek在模型架構與訓練方法上進行了大量獨立且底層的顛覆性創新。例如,其採用了極大規模的混合專家模型(MoE)、獨創的多頭潛在注意力機制(MLA),並在罕見地應用了純強化學習(RL)演算法來動態調整模型參數,這些創新提升了模型的推理能力並降低了訓練成本。這種為人工智慧技術演進貢獻了非線性創新增量與技術路線互補性的行為,顯然超越了單純搭便車的範疇,屬於正當的市場競爭行為。雖然其他平台服務條款中可能包含禁止反向工程等限制性規定,但如果掌握技術優勢的企業借此絕對禁止他人對其公開產品進行規律性分析,可能會不當壓縮技術交流的公共空間,甚至引發關於限制競爭的懷疑,反而應當受到反壟斷法的嚴厲規制。04侵權事實的證明障礙從法律實務的維度剖析,Anthropic在本次指控實踐中面臨著幾乎難以完成的舉證責任。首先,高頻次的系統呼叫記錄並不能直接等同於侵權證據。Anthropic宣稱的1600萬次互動,客觀上描述了資料呼叫量級,但無法直接證明DeepSeek、Moonshot等企業實質性地利用了從這些互動中獲取的特定知識,並將其直接用於了自家大模型的底層訓練之中。在法律意義上,相關呼叫記錄無法形成有效因果關係,高頻次的互動既可能是為了常規的複雜業務應用測試,也可能是為了建構開源資料集,沒有任何直接且有效的技術手段能夠確鑿證明,DeepSeek等企業將這些具體的互動資料實質性地喂給了其基礎模型的訓練引擎並構成了所謂的蒸餾。其次,是當前網際網路普遍存在的資料污染現象。大模型在預訓練階段通常會廣泛抓取公開網頁資料 。而如今的網際網路上已經包含了大量由各種先進AI生成的文字和答案。後來者的模型在吸收這些公開資料時,不可避免地會間接受益於前沿模型的知識。這種並非出於主觀故意的被動吸收,使得區分惡意蒸餾與常規資料訓練變得異常困難。05寫在最後模型蒸餾作為推動人工智慧向高效化、輕量化發展的有效路徑,其本身是具有技術合理性的創新手段,無需也不應受到不合理的法律過度限制。綜合Anthropic的侵權指控,其將面臨權利基礎薄弱、合理使用抗辯、以及嚴苛舉證責任的多重困境,其法理根基是非常脆弱的。剝開法律與技術的層層外衣,我們不難推斷,為了打壓中國的新型競爭對手並維持高昂的資本估值,Anthropic不惜將純粹的技術競爭強行上升到國家安全問題,以迎合美國現政府的政策口徑,以此換取更寬鬆的監管環境以及持續不斷的政府訂單輸血。透視Anthropic此次高調的指控,我們更應警惕其中潛藏的雙重標準:矽谷的科技巨頭們最初賴以起家的基座模型,正是建立在未經授權、大規模抓取網際網路公開資料的基礎之上;而如今,當它們形成了事實上的技術壟斷後,卻試圖通過一紙的使用者協議關上大門,將後來者合法的蒸餾學習污名化為偷竊。正如埃隆·馬斯克所嘲諷的那樣,這種“只許矽谷‘偷資料’,不許中國‘做蒸餾’”的做法,其實質是打著保護智慧財產權的幌子,行技術霸權與數字壟斷之實。 (騰訊科技)