#DeepSeek
奧特曼住所遭燃燒彈襲擊,嫌疑人揚言燒燬OpenAI總部/曝DeepSeek V4本月下旬發佈/AI能力將成教師「必考項」
🤖阿里認領屠榜神秘模型「歡樂馬」,ATH 鄭波團隊打造🤯山姆·奧特曼住所遭燃燒彈襲擊、OpenAI 總部遭威脅🧠梁文鋒內部透露:DeepSeek V4 將於 4 月下旬正式亮相🌚「龍蝦之父」Claude 帳號被封又解封,官方:系統誤判📋AI 能力將成教師「必考項」📱億咖通科技官宣正式承接 Flyme OS 全業務💻蘋果 Mac 一季度出貨量增長 9%,增速領跑全球 PC 市場📲微信官宣九項新功能:公眾號上線「話題」功能,跨裝置傳檔案無需加好友💰追覓俞浩:要把宇樹的一切全部搶過來🦿集邦諮詢:今年中國人形機器人產量預計年增 94%,宇樹、智元合計佔八成份額🔍小米 7 篇論文入選 ACL 2026:推理快 8 倍、80 頁合同秒讀🚀生數科技完成近 20 億元 B 輪融資,阿里雲領投🛑無償轉讓失敗,360doc 個人圖書館宣佈 5 月 1 日關停💡Arm CEO:AI 自研晶片潛在市場超 1000 億美元,可觸達總市場或破兆🚗限時 19.39 萬元起,煥新極氪 007GT 正式上市🚙華為 Pura 90 定檔 4 月 20 日💻盧偉冰官宣 REDMI Book Pro 2026,本月發佈🚗小鵬 x 福耀量產 AI 調光隱私玻璃,GX 首發搭載📰 周末也值得一看的新聞阿里認領屠榜神秘模型「歡樂馬」,ATH 鄭波團隊打造昨天,阿里巴巴 ATH 確認神秘屠榜視訊模型 HappyHorse 為旗下創新事業部研發。此前,該模型在 AI 評測平台 Artificial Analysis 視訊競技場榜單上橫空出世、以壓倒性表現登頂文生視訊、圖生視訊等多個賽道,直接超越近期熱度頗高的字節 Seedance 2.0,引發廣泛猜測。APPSO 獨家獲悉,負責 HappyHorse 視訊生成模型的是來自阿里 ATH 的鄭波團隊。鄭波現任阿里巴巴副總裁,2017 年 9 月加入阿里巴巴後歷任淘寶搜推演算法負責人、阿里媽媽 CTO、淘天集團演算法技術負責人,研究方向涵蓋大模型、多模態、決策智能、深度學習及搜尋推薦廣告演算法等領域。阿里方面表示,HappyHorse 目前仍處於內測階段,API 介面計畫於 4 月 30 日開放。該模型支援四種視訊生成模式:文字轉視訊與圖像轉視訊,每種模式均可選擇是否加入原生音訊。ATH 創新事業部同時透露,已啟動一項面向 AI 時代全新互動方式的探索計畫,HappyHorse 是該方向的組成部分,後續還將陸續推出更多產品。阿里方面同時提示,此前網路上流傳的「官網」均非官方管道。山姆·奧特曼住所遭燃燒彈襲擊、OpenAI 總部遭威脅據 CNBC、BBC 報導,當地時間 4 月 10 日凌晨 4 時 12 分,一名男子向 OpenAI CEO 薩姆·奧特曼(Sam Altman)位於北海灘(North Beach)的私人住宅投擲燃燒彈,導致大門外側起火後徒步逃離現場。約 55 分鐘後,同一名男子出現在 OpenAI 舊金山總部大樓外,公開揚言要焚燒整棟建築,隨即被趕到的警方當場逮捕。該嫌疑人為一名 20 歲男性,目前已被羈押,具體身份及犯罪動機尚未公佈,案件調查仍在進行中。事件中無人員傷亡。OpenAI 發表聲明稱:「感謝舊金山警方的快速響應以及市政府在保障員工安全方面給予的支援。嫌疑人目前已被羈押,我們正全力配合執法部門的調查工作。」奧特曼當天在個人部落格上就此事公開發聲,並附上了一張家人合影。他寫道,自己「低估了語言和敘事的力量」,並表示過去幾年「極度緊張、混亂且充滿壓力」,呼籲 AI 行業各方對「言辭和行動方式」進行降溫。他同時表示理解外界對技術的批評與擔憂,但仍堅信技術進步能夠為未來帶來積極影響。梁文鋒內部透露:DeepSeek V4 將於 4 月下旬正式亮相據《創智記》報導,DeepSeek 創始人梁文鋒近日在內部溝通中透露,DeepSeek V4 將於本月下旬正式發佈。此前,V4 的發佈時間已多次延期。原計畫於今年 2 月中旬春節前後推出,後因國產算力深度適配、架構重構與穩定性打磨等原因持續推遲。在技術層面,V4 將帶來兆參數規模與百萬級上下文窗口,並首次實現與華為昇騰等國產晶片的深度適配。據悉,V4 最大的技術亮點在於 LTM(Long Term Memory,長期記憶)能力的突破。儘管外界期待頗高,但多位與 DeepSeek 深入合作的 AI 創業者提示,V4 很難再複製去年 DeepSeek-V3 的市場影響力。與此同時,梁文鋒正推動公司從純模型研發嚮應用層延伸,組建產品團隊,並啟動公司估值以明確員工期權價值。「龍蝦之父」Claude 帳號被封又解封,官方:系統誤判今天凌晨,OpenClaw 的創始人 Peter Steinberger 在 X 平台發文,稱自己的 Claude 帳號遭到封禁。他曬出了一封來自 Anthropic 安全團隊的郵件,郵件措辭簡短,僅表示「認定存在違反使用政策的行為」,未說明具體違規條款,亦無任何事先警告。Steinberger 表示,被封禁的不只是 API 存取權,個人帳號同樣受到波及,這意味著他連日常的相容性測試都無法正常進行。以後要確保 OpenClaw 還能跑在 Anthropic 的模型上,恐怕是越來越難了。Anthropic 員工 Thariq Shihipar 隨後出現在評論區,表示封號「很可能是另一個有點過於敏感的濫用檢測分類器誤判了」,並非針對 OpenClaw 使用者的主動決定,並承諾私信 Steinberger 協助處理。不久後,Steinberger 發推確認帳號已恢復。🔗 相關閱讀:突發|龍蝦之父的 Claude 被封了,官方:系統誤判AI 能力將成教師「必考項」據新華社、央視新聞報導,教育部等五部門近日聯合印發《「人工智慧+教育」行動計畫》,旨在一體推進人工智慧人才培養與應用創新,系統建構智能時代的教育體系。昨日,教育部在新聞發佈會上披露了該行動計畫的核心內容。其中最受關注的一項舉措是:人工智慧將被正式納入教師資格考試和認證內容,AI 能力將成為未來教師的基本職業素養之一。教學上,行動計畫提出圍繞課前、課中、課後的全流程教學場景,加強智能教學系統的應用,幫助教師減負增效;同時輔助開展作業管理,推進智能批改、答疑和輔導;借助智能技術分析課堂教學行為,幫助教師提升教學質量;面向基礎教育,行動計畫明確加快普及中小學生人工智慧教育,要求開齊、開足、開好相關課程,推動人工智慧教育全面納入地方課程體系。此外,計畫還鼓勵開展人工智慧跨學科教學,推動其融入課後服務、研學實踐等環節;在高等教育層面,行動計畫要求推動人工智慧成為高校公共基礎課,按學科專業分類編寫教材,推動全體學生掌握 AI 相關知識。與此同時,高校將被引導開設人工智慧交叉融合課程,豐富跨學科、跨專業課程群,培養複合型交叉人才,並根據產業結構的智能化升級趨勢,新設一批適應新技術、新產業、新業態的學科專業。億咖通科技官宣正式承接 Flyme OS 全業務億咖通科技昨日宣佈,正式啟動承接星紀魅族集團旗下 Flyme OS 全部核心資產與業務。根據整合安排,Flyme OS 品牌所涵蓋的全部智慧財產權,以及 Flyme Auto 的全部在運業務、客戶合同及研發團隊,將整體納入億咖通科技,由公司統一營運管理。億咖通科技由吉利控股集團創始人李書福與沈子瑜於 2016 年聯合創立,吉利控股是其重要戰略股東——今年 1 月,吉利控股剛以每股 1.67 美元的價格完成對億咖通 4560 萬美元的定向增持。此次 Flyme OS 業務整合,正是吉利體系內「一個吉利」戰略收縮與資源集中的延續動作,旨在將旗下智能出行相關資產統一歸口至億咖通平台營運。依託在智能座艙軟硬體平台及全球化交付方面的既有能力,億咖通科技將加速作業系統與車載應用場景的適配,提升協同效率和產品迭代能力。整合工作將按照業務優先順序有序推進,明確權責邊界,妥善安置員工,確保平穩過渡。後續,億咖通科技計畫整合 Flyme OS 產品優勢,融入 AI 智能體,建構跨終端智能生態,加速出行場景 AI 共生。蘋果 Mac 一季度出貨量增長 9%,增速領跑全球 PC 市場市場研究機構 IDC 發佈的最新資料顯示,蘋果 2026 年第一季度 Mac 出貨量同比增長 9%,增速跑贏全球 PC 大盤。同期,全球 PC 市場整體增長率僅為 2.5%。該季度,蘋果 Mac 總出貨量達 620 萬台,較去年同期的 570 萬台穩步提升;全球市場份額方面,蘋果由去年同期的 8.9% 攀升至 9.5%,在 PC 廠商中穩居全球第四。榜單前三名依次為聯想(1650 萬台)、惠普(1210 萬台)和戴爾(1030 萬台)。IDC 統計顯示,除惠普外,多數頭部 PC 品牌均在該季度實現出貨量正增長。微信官宣九項新功能:公眾號上線「話題」功能,跨裝置傳檔案無需加好友昨天,微信官方號「微信公開課」發文,盤點了 3 月集中推出 9 項功能更新,覆蓋內容創作、跨境支付、檔案傳輸、商業生態等多個維度:公眾號新增「話題」功能,創作者可主動發起話題並搭建專屬話題頁,將自己發佈及粉絲產出的同類內容聚合展示,使用者可通過圖文正文中的 #話題連結、文章底部的「更多相關內容」以及公眾號「看一看」三個入口進入;視訊號帶貨短影片發佈條數增加,擁有 1000 粉絲且具備短影片商品分享權限的創作者,10 萬粉以下帳號每天可發 5 條,10 萬粉及以上帳號每天可發 10 條;視訊號短影片同步支援掛載「商品合集」,創作者可將多款關聯商品一次性打包上架,實現一條視訊帶貨多個商品;視訊號小遊戲優質作者激勵計畫啟動,活動持續至 4 月 30 日,粉絲數超過 1000 的視訊號或外站創作者報名後發佈符合要求的視訊並掛載小遊戲變現任務,即可獲得基礎現金激勵,爆款視訊還可獲得額外獎勵,上不封頂;微信、企業微信支援接入 AI 智能體,微信上線 ClawBot 外掛能力,使用者可通過微信聊天方式連接自己的龍蝦(Claw);企業微信推出掃碼接入「龍蝦」功能,並將 CLI 開放原始碼專案正式上架 GitHub,面向 10 人及以下企業,支援 Claude Code、Codex、Work Buddy、QClaw 等主流 AI 智能體,向 AI 開放消息、日程、文件、會議等 7 大核心能力;新增面對面跨裝置掃碼傳檔案功能,支援 iPhone 與Android手機之間互傳照片和檔案,無需加入好友,支援原圖直傳,且不依賴行動網路或外部 Wi-Fi 網路;壓縮包支援直接預覽,收到壓縮包後無需下載或解壓即可查看內容,還可選擇單個或多個檔案進行一鍵保存、轉發或收藏;首爾地鐵 1 至 8 號線全站新型售票機支援微信支付購票,除單程票外,還可掃碼購買 T-money 卡、氣候卡及定期票;微信小店商品標籤上新,騰訊廣告(小店版)新增「熱搜品」和「機會品」標籤,系統將對商家已託管及未託管商品進行標註,幫助商家更高效識別高潛商品;微信小店推出新商家六大權益,包括 0 保證金試營運、自營交易額技術服務費率降至 1%、流量激勵、成長攻略以及百款經營工具免費試用,助力新商家快速冷啟。追覓俞浩:要把宇樹的一切全部搶過來據介面新聞報導,昨日,一張追覓科技創始人俞浩在內部工作群「魔法原子」中發佈的聊天截圖曝光。截圖顯示,俞浩以強硬語氣要求團隊對競爭對手宇樹科技展開全面反擊,並提出「2 億年薪招首席科學家」,同時要求搶奪宇樹科技的客戶、投標、員工及直播間資源,甚至喊出「宇樹的所有客戶、所有投標、所有員工要全部搶過來」。魔法原子是追覓科技旗下專注具身智慧型手機器人業務的核心主體,由俞浩擔任創始人與實際控制人。集邦諮詢:今年中國人形機器人產量預計年增 94%,宇樹、智元合計佔八成份額根據 TrendForce 集邦諮詢最新的人形機器人深度研究報告,今年下半年全球人形機器人產業將進入商業化的關鍵階段。中國廠商積極提升產量,預計將推動今年全年中國人形機器人市場產量年增高達 94%。研報預計,宇樹科技與智元機器人憑藉各自的盈利能力與量產進度,在激烈競爭中脫穎而出,兩者合計預計將囊括近 80% 的市場出貨份額。宇樹科技於三月底申請科創板 IPO 並獲受理,上市招股書顯示其 2025 年人形機器人產品收入首度超越四足機器人,佔總收入 51% 以上,兩項業務合計毛利率達 60%,打破了外界對機器人產業「只燒錢不盈利」的固有印象。智元機器人於三月底迎來第 10000 台通用具身機器人遠征 A3 完工出廠。智元將 2025 年量產數量從 1000 台提升至 5000 台後,僅用三個月便達成了一萬台的里程碑。從整體產業趨勢來看,TrendForce 集邦諮詢指出,此前多數人形機器人廠商專注於感知、動態平衡與語義理解等底層能力的積累,今年下半年焦點將轉向為使用者提供真實價值。小米 7 篇論文入選 ACL 2026:推理快 8 倍、80 頁合同秒讀昨天,小米技術宣佈,小米 AI 團隊共有 7 篇研究成果入選 ACL 2026,覆蓋端側推理最佳化、多頁文件理解、長上下文注意力、通用資訊抽取、對話語音生成、手機 AI 智能體評測與訓練策略七個方向。ACL 是自然語言處理領域 CCF-A 類頂級會議,本屆大會將於今年 7 月在美國聖地亞哥舉行。推理最佳化方向,VecInfer 通過向量量化壓縮 KV cache,在 196k 上下文的 Llama-3.1-8B 上實現 8.3 倍端到端延遲降低,2-bit 量化下仍接近全精度性能;文件理解方向,Doc-V* 無需 OCR 即可處理 80 頁以上長文件,在四個公開基準上取得開源最優,相比 RAG 基線提升 9.8 個百分點;針對大模型「只看首尾、忽略中間」的問題,Attention Basin 提出 AttnRank 方法,僅通過輕量文件重排即可提升長文理解,無需訓練、零額外延遲;語音方向,ZipVoice-Dialog 實現非自回歸雙人對話語音生成,團隊同步開源了首個 6800 小時規模對話語音資料集 OpenDialog;AI 智能體評測方面,MobileBench-OL 覆蓋 80 款中文主流應用的 1080 個任務,結果顯示當前最強 AI 面對 20 步以上操作的成功率不足兩成;訓練策略方面,STEP 以成功率感知的自適應重採樣集中訓練困難任務,在相同計算預算下收斂更快;ProUIE 則以 4B 參數骨幹、不引入任何外部資訊,在 36 個公開資料集上超越多種強基線。生數科技完成近 20 億元 B 輪融資,阿里雲領投生數科技昨天宣佈完成近 20 億元人民幣 B 輪融資,由阿里雲領投,中網投、九安海棠、好未來、光合創投等機構戰略投資,星連資本、達泰資本、建發新興投資、BV 百度風投、卓源亞洲等原有股東持續追加。融資完成後,生數科技表示將持續夯實通用世界模型底層能力,並加速全球化人才佈局,建構支撐前沿模型與全球業務發展的核心團隊。無償轉讓失敗,360doc 個人圖書館宣佈 5 月 1 日關停據鞭牛士報導,營運逾二十年的個人知識庫平台 360doc 個人圖書館宣佈,將於 2026 年 5 月 1 日正式終止所有服務。創始人蔡智發佈告別信稱,過去兩個月他嘗試將平台無償轉讓,但最終以失敗告終。他曾與具備承接能力的網際網路巨頭洽談,做過方案、推進過試點,「也等過、求過、忍過」,但最終「被擱置,被推諉,熬盡了最後一絲力量」。此前今年 1 月,360doc 曾發佈無償轉讓公告,尋求具備誠意與能力的夥伴接管平台全站資產,包括核心技術、資料及營運團隊,並要求接手方具備不少於 500 萬元的資金實力,以及清晰可行的持續營運計畫。蔡智在信中透露,也有跨界朋友與創業公司遞來橄欖枝,但他最終未予選擇,原因是「沒有網際網路經驗、沒有 AI 能力,這個平台接過去,只會變成負擔」。他同時堅決拒絕了試圖購買域名和使用者資料的人,「8000 萬使用者的資料,一旦流入灰產,後果不堪設想」。蔡智表示,與其將隱患留給未來或被轉賣,「不如在還可控的時候,親手畫上一個穩妥的句號」。360doc 個人圖書館於 2005 年上線,目前平台使用者超 8000 萬,收錄文章逾 11 億篇。💡 Arm CEO:AI 自研晶片潛在市場超 1000 億美元,可觸達總市場或破兆據彭博社報導,Arm CEO Rene Haas 昨天在採訪中表示,AI 浪潮正在為晶片行業帶來規模高達千億美元的市場機遇,而 Arm 已將戰略重心從智慧型手機轉向資料中心與雲端運算。Haas 指出,智能體 AI(Agentic AI)的興起對 CPU 算力的需求是傳統 AI 的四倍,而當前資料中心市場對這一需求的供給嚴重不足。他同時透露,已有多家客戶主動向 Arm 提出定製晶片的需求,這也促使公司推出了首款自研晶片產品。該產品名為 Arm AGI CPU,由 Arm 自主設計、台積電代工製造,目前已獲得 Meta、SAP、Cloudflare、Cisco、OpenAI 等多家企業的訂單,預計將於今年年底開始出貨。在市場規模方面,Haas 給出了一組對比鮮明的數字:Arm 傳統授權模式下,雲端運算與 AI 業務帶來的版稅收入對應的潛在市場規模約為 30 億美元;而 AGI CPU 這條新產品線在未來四至五年內,潛在市場規模將超過 1000 億美元。若將機器人、可穿戴裝置等更廣泛的 AI 應用場景納入考量,Arm 可觸達的整體市場規模甚至可能超過 1 兆美元。Haas 強調,AI 是一項「觸達整個地球」的技術,無論是資料中心、機器人還是小型可穿戴裝置,Arm 均有機會以 IP 授權、計算子系統或晶片產品的形式參與其中。他認為,Arm 的市場機遇「已經變得遠比以前寬廣得多」。限時 19.39 萬元起,煥新極氪 007GT 正式上市昨日,極氪在發佈會上正式推出煥新極氪 007 與煥新極氪 007GT,兩款車型採用同價策略,官方指導價均為 20.39 萬元起,限時上市權益價 19.39 萬元起。007GT 後驅版零百加速 4.8 秒,四驅版 2.85 秒;75kWh 神盾金磚電池 / 103kWh 麒麟電池對應 CLTC 續航 702km / 880km,分別支援 5.5C 和 6C 快充,SoC 10% 至 80% 最快 10 分鐘;車身長寬高 4858/1900/1450mm,軸距 2925mm;新增 FR-LINE 性能套裝,含 20 吋雷霆鍛造輪圈、橙色四活塞卡鉗及競速黃 Dinamica 運動內飾;標配 31 個感知硬體(含 1 顆雷射雷達)+ Thor-U 晶片,千里浩瀚 H7 方案,新增 120km/h 高速爆胎穩定控制;高通驍龍 8295 晶片,35.5 英吋 AR-HUD + 15.4 英吋 2.5K 中控屏 + 13.02 英吋儀表屏三聯屏;標配閉式空氣懸架 + CCD 電磁減振 + 智能魔毯,新增運動 + 模式,四驅版可選賽道模式;後備廂 645L,最大拓展至 1737L,支援 150kg 車頂行李架與 1.6 噸電動拖車鉤。華為 Pura 90 定檔 4 月 20 日昨天,華為宣佈,Pura 系列及全場景新品發佈會將於 4 月 20 日 14:30 舉行。本次發佈會預計推出影像旗艦 Pura 90 系列、全新「闊折疊」Pura X Max,以及涵蓋耳機、手錶、AI 眼鏡在內的多款可穿戴新品。華為同步放出了 Pura 90 Pro Max 的外觀。機身延續三角形相機 Deco 的家族設計,但螢幕形態從前代等深四曲屏改為與 Mate 80 系列一致的直屏設計。影像方面,據數位閒聊站爆料,Pura 90 Pro Max 將搭載 2 億像素、1/1.28 英吋潛望鏡,配備定製大光圈與長焦微距,「一鏡雙目」特性大機率不會繼承;1 英吋主攝很可能僅為 Pura 90 Pro Max 獨佔,其餘版本採用 1/1.28 英吋主攝。配色共五款,分別為主打色「橘子海」、「霞光紫」(紫黃漸變)、「翡翠湖」(綠白漸變)、「曜石黑」和「晨曦金」。盧偉冰官宣 REDMI Book Pro 2026,本月發佈昨天,小米集團合夥人、總裁盧偉冰官宣了 REDMI Book Pro 2026 筆記本,將於本月與 REDMI K90 Max 同場發佈,定位 REDMI 全新高性能 AI 旗艦筆記本。網傳爆料如下:提供 14 英吋和 16 英吋雙版本,沿用前代模具設計;最高搭載第三代英特爾酷睿 Ultra X7 358H 處理器,配合 LPDDR5X 高頻記憶體,支援擴展至 32GB + 1TB / 4TB PCIe 4.0 SSD;搭載全新超級小愛,支援在本地建立個人知識庫,實現跨裝置檔案檢索的同時保護使用者隱私;新增一鍵遠端開關機功能,滿足使用者在外應急辦公的需求;16 英吋版本配備 99Wh 超大容量電池,14 英吋版為 92Wh,能量密度較前代提升 9.6%,均支援 90W PPS 反向快充,可為手機進行快速充電。小鵬 x 福耀量產 AI 調光隱私玻璃,GX 首發搭載昨天,小鵬集團與福耀集團在福州福耀玻璃園區聯合舉辦發佈活動,雙方共同研發的 AI 調光隱私玻璃正式亮相,並完成首塊量產交付。這款玻璃將首發搭載於小鵬 GX。其核心技術基於 LC 染料液晶原理,通過電場控制分子排列來調節透光度,並結合整車電子電氣架構與 AI 大模型實現智能適配。調光響應速度達到 0.16 秒,隱私模式下透光率最低可至 0.6%,調節跨度超過 12%;暗黑狀態下可隔絕 99.9% 的紫外線與 99.4% 的可見光;小鵬 GX 全車共搭載 6 塊 AI 調光隱私玻璃,總面積達 1.88 ㎡,為同級最大;採用 5 層夾膠結構配合定製隔音膜片,相比同厚度鋼化玻璃可降低 3 ~ 5 dB 噪音;電控液晶調光技術全程無化學變化、無材料磨損,官方稱可實現百萬次調光無衰減;支援 AI 自適應調光,依託外部光照感知實現無級調節,自動匹配最優透光度。無問芯穹發佈端雲一體智能終端 InfiniClaw Box無問芯穹昨天正式發佈端雲一體智能終端 InfiniClaw Box,主打隱私保護,在本地完成資料脫敏、借助雲端大模型推理、再將結果回填至本地,全程實現「資料不出盒」。全模態脫敏:支援文字、圖像、音訊、視訊資料的本地脫敏處理,可自動識別並替換姓名、手機號、身份證號、財務資料、醫療記錄等敏感資訊,突破現有方案僅覆蓋文字的侷限;雲端強模型呼叫:脫敏後的請求接入無問芯穹大模型服務平台,可低成本呼叫 GLM-5、Kimi-K2.5、MiniMax-M2.5、Step-3.5 等頭部模型完成複雜推理,雲端全程無法接觸原始資料;本地隱私回填:雲端結果由本地「隱私重構引擎」進行精準位置感知的自動回填,確保輸出的完整性與上下文一致性與純雲端處理無異;多信源接入:支援連接家庭攝影機、智能門鎖、外接麥克風,並計畫接入電腦、智能眼鏡、手機、平板等終端,提供標準化開放介面;晶片性能最佳化:通過深度 NPU/GPU 算子融合、張量佈局尋優與視訊記憶體復用,Attention 和 GEMM 等核心算子實現 10% 至 40% 的加速;內建垂類 Skills:預置超過 80 個面向政務處理、投資研報、智慧辦公等場景的專業 skill。在生態層面,InfiniClaw Box 已與愛芯元智、AMD、此芯科技、財搭子、萬象智維、酷愛科技、躍向等企業建立合作,覆蓋晶片適配、外設互聯與應用場景共創等多個維度。MiniMax Music 2.6 發佈昨天,MiniMax 正式發佈新一代音樂生成模型 Music 2.6。據悉,此次更新對底層生成架構進行了深度重構,首包延遲大幅降至 20 秒以內,並在音樂控制能力與聲學品質方面實現全面提升。MiniMax 還推出了全新的「Cover」創作功能,面向全球創作者開啟為期 14 天的免費內測。MiniMax 同步推出並開源了 3 個 Music Skill:minimax-music-gen2(專屬音樂人)、minimax-music-playlist(個性歌單生成器)和 buddy-sings(寵物歌手),旨在將專業音樂生成能力直接融入 AI 開發者生態。智源開源 AI 智能體安全框架 ClawKeeper近日,北京智源人工智慧研究院聯合北京郵電大學與中國資訊通訊研究院發佈 AI 智能體即時安全框架 ClawKeeper v1.0,項目已在 GitHub 開源,論文同步發佈。ClawKeeper 專為 OpenClaw 平台設計,核心思路是「用 AI 智能體監管 AI 智能體」,首創技能(Skill)、外掛(Plugin)、觀察者(Watcher)三層防禦架構,覆蓋 AI 智能體全生命周期安全。其中,完全獨立於業務邏輯之外的 Watcher 元件作為系統級安全中介軟體,可即時評估每一輪互動的工具呼叫軌跡,在檢測到高危操作時直接接管執行流程並強制觸發人工確認,徹底解決了傳統方案中「安全與效率相互牽制」的根本矛盾。在基準測試中,ClawKeeper 對提示詞注入、憑據洩露、危險命令執行等 7 類高危場景實現 100% 覆蓋,防禦成功率達 85% 至 90%。Watcher 還具備持續學習能力,在連續處理 100 個對抗性樣本後,防禦成功率從 90% 進一步提升至 95%。💻 GitHub: github.com/SafeAI-Lab-X/ClawKeeper📑 論文:arxiv.org/abs/2603.24414現代電動品牌 IONIQ 將通過北現工廠進行國產據藍鯨汽車報導,現代汽車旗下電動化品牌 IONIQ(艾尼氪)將通過北京現代工廠進行國產,正式以品牌形式進入中國市場。此前,IONIQ 旗下車型曾以進口形式在國內銷售。今年,IONIQ 將有新車上市,未來三年還將推出多款車型,覆蓋中、大型細分市場,涵蓋 SUV 和轎跑兩種車身形式,提供純電和增程兩種動力選擇。據悉,其全系產品將以圍繞太陽公轉的行星命名,由中國設計團隊原創打造。在本土化策略上,IONIQ 將在設計、技術、產品和營運四個維度深度落地。電池方面,該品牌預計將與寧德時代合作;智能駕駛方面,將與 Momenta 展開合作。管道上,品牌計畫打造「北京現代汽車文化中心」等超越傳統汽車展廳的品牌據點。IONIQ 品牌成立於 2020 年,由現代汽車早期的同名單一車型演變而來。2021 年 2 月,IONIQ 5 正式發佈,此後相繼推出 IONIQ 6、IONIQ 9 及高性能版本 IONIQ 5N 等全球車型,品牌累計銷量目前已超過 55 萬輛。Alienware 外星人遊戲嘉年華下周登陸上海Alienware 外星人遊戲互動嘉年華將於今年 4 月 17 日至 18 日登陸上海西岸穹頂藝術中心,活動集中呈現 40 餘款全球熱門遊戲 IP、電競賽事、Coser 巡遊及品牌產品體驗。本次嘉年華設有專屬產品體驗區,Alienware 外星人高端遊戲 PC、專業電競顯示器、職業級電競外設及全新輕薄旗艦本將悉數亮相,搭配超百台 Alienware 外星人高性能電競裝置供玩家上手試玩。賽事層面,Alienware 自營電競賽事品牌 AGA(ALIENWARE GAME ARENA)春季城市總決賽將於 4 月 17 日在主舞台打響,來自全國各大賽區的選手將同台角逐。Alienware 外星人高校電競賽總決賽同期舉行,由上海海洋大學與中南大學展開對決。康師傅「再來一瓶」全國兌獎難引發投訴潮據介面新聞報導,康師傅今年 3 月重啟的「再來一瓶」促銷活動遭遇「兌獎難」問題。該活動涵蓋兩種規格綠茶產品,虛擬獎品總量超 4400 萬份,兌獎期截至今年 9 月 30 日。陝西西安朱先生按小程序指引輾轉 4 家門店均遭拒;山東淄博邵先生多次中獎,撥打客服電話遲遲未獲回覆;天津王女士跑遍五六家門店無功而返,客服承諾「專人跟進」,直至獎品過期也無人聯絡。有消費者直言:「沒有兌換能力就別做活動」。不吸也違法:香港公共場所全面禁止持有電子煙據南都·灣財社報導,香港將於今年 4 月 30 日起正式實施最嚴控煙新規,禁止任何人在公眾場所持有電子煙、加熱煙及草本煙。值得注意的是,即便只是隨身攜帶而未實際吸食,同樣構成違法。根據香港《2025 年控煙法例(修訂)條例》,違規處罰按持有數量分為兩檔:持有不超過 5 個煙彈、5 毫升煙油、100 支加熱煙支或 100 卷草本煙的,將被處以 3000 港元定額罰款;若持有量超出上述標準,則以檢控方式處理,一經定罪最高可被罰款 5 萬港元並處監禁 6 個月;若當事人拒絕配合提供身份證明或故意妨礙執法,罰款上限可升至 1 萬港元。在執法範圍上,公眾場所涵蓋街道、商場、公園,以及住宅大廈或辦公樓的公共區域(如大廳、電梯、走廊等),目前唯一合法持有的場所僅限私人住宅內部。香港衛生署明確表示,新規自 4 月 30 日起即嚴格執行,不設過渡期,亦不存在「首次違規先警告」的機制,赴港旅客同樣不會獲得豁免。✨ 是周末啊!One Fun Thing|SBTI 人格測試一夜刷屏:31 道題罵你是「廢物」,伺服器崩了三次日前,一款名為 SBTI(Silly Big Test Inventory)的人格測試沖上熱搜,並在朋友圈引發大規模刷屏。🔗 相關閱讀:SBTI說我廢物,這是今年聽過最舒服的一句話該測試以 MBTI 為框架,推出了「尤物」「嗎嘍」「廢物」「死者」等一系列荒誕自嘲標籤,測試頁面更是直接喊出「MBTI 已經過時,SBTI 來了」。SBTI 共設 31 道題,耗時約 5 分鐘,不問壓力與情緒,只問日常態度與生活習慣,最終給出帶有強烈戲謔色彩的人格判定。區別於 MBTI 慣用的正向描述,SBTI 的人格描述以自嘲和調侃為主,例如「廢物」人格寫道:「給廢物一顆糖,它會還你一個完全信任你、亮晶晶的眼神。」由於流量過於集中,SBTI 伺服器數度崩潰,大量使用者只能靠截圖「雲體驗」。據測試頁面介紹,該測試由 B 站 UP 主 @蛆肉兒串兒 製作,最初的起因極為日常——只是想勸一位愛喝酒的朋友戒酒。作者自稱人格為「SHIT」,並表示「由於作者的人格是憤世者,所以平等地攻擊了各位,在此抱歉!」作者同時說明,自己並非心理學專業,測試內容以娛樂為主。沒有很好地平衡娛樂和專業性,對於一些人格的闡釋較為模糊或完全不准,如有冒犯非常抱歉。4 月 10 日深夜,作者發佈新連結,稱已按建議做出略微修改,「應該不會再崩了」。💻 GitHub: github.com/UnluckyNinja/SBTI-test👉 測試入口: https://sbti.unun.dev周末看什麼|《挽救計畫》《挽救計畫》(Project Hail Mary)由菲爾·羅德與克里斯托弗·米勒聯合執導,德魯·戈達德編劇,改編自安迪·威爾同名暢銷科幻小說。影片主演瑞恩·高斯林飾演中學科學教師瑞恩·格雷斯——一個被動捲入人類存亡危機的「工具人」。故事設定中,一種名為「噬星體」的太空微生物正在吞噬太陽,地球文明面臨滅頂之災。格雷斯在毫無選擇的情況下被送上單程太空任務,孤身前往鯨魚座 T 星尋找解法。途中,他意外與同樣身處絕境的外星工程師「洛基」相遇,兩個截然不同的文明由此展開跨物種協作,共同破解噬星體的威脅。截至目前,《挽救計畫》在豆瓣獲得 8.6 分,逾 32 萬人參與評分。買書不讀指南|《大廠小民:我在網際網路公司的 1480 天》這本書以第一人稱視角記錄了張小滿在網際網路大廠工作四年的親歷。作為中台部門的一線員工,她在 1480 天裡經歷了一次「創業」、三個崗位、七次考核、兩次被裁員。她將這份工作比喻成「一顆來自他人寄存的水晶,如此可貴又如此容易失去」。她將大廠員工歸納為三類:深耕專業領域的「掃地僧」、擅長包裝說服的「銷售員」,以及默默耕耘卻與升職加薪無緣的「農民」。人人都希望成為「掃地僧」,但最後大部分人都做了「農民」的事。完備福利與高壓考核並存,正是大廠讓人「一邊批判,一邊把追隨變成習慣」的根源。張小滿最終在經濟下行期被裁員,此後完成寫作,追問工作的本質:「工作本質是交易,但不應只是如此。」遊戲推薦|《紅色沙漠》《紅色沙漠》(Crimson Desert)是由韓國開發商 Pearl Abyss 開發並行行的開放世界動作冒險遊戲,以僱傭兵 Kliff 為主線角色展開敘事。遊戲融合了探索、戰鬥、解謎、迷你遊戲等多元玩法,野心勃勃地試圖將《巫師 3》式的冒險、《荒野大鏢客:救贖 2》式的慢節奏敘事、《王國之淚》的開放解謎與《上古捲軸》系列的自由度整合於一體。遊戲上線後口碑呈現明顯的兩極分化。媒體聚合平台 Metacritic 給出 PC 版綜合評分 78/100,OpenCritic 評論推薦率為 82%。IGN 評測人 Travis Northup 在經歷約 130 小時的主線及支線流程後,給出 6/10 的評價,稱其「極具野心,卻在令人印象深刻與令人抓狂之間劇烈搖擺」。 (APPSO)
美國百年大刊:DeepSeek只是個前菜,中國最安靜超車已來?
2025年初,一個叫DeepSeek的中國本土AI模型,用美國同行幾十分之一的算力和成本,打平了矽谷最頂尖的閉源模型,美國科技股應聲暴跌,矽谷精英們在推特上瘋狂復盤,哀鴻遍野。圖片 | 來自網路所有人都以為,這是一個突發的“斯普特尼克時刻”,就像1957年蘇聯衛星上天,震驚全美那樣。但真正的歷史大轉折,從來沒有轟轟烈烈的爆炸聲,它發生的時候,往往是靜音的。美國百年大刊《大西洋月刊》最近刊登了一篇極具震撼力的長文,作者羅斯·安德森(Ross Andersen)說:中美科技實力的攻守易勢,是一場悄無聲息的、只有極少數專門研究“科學之科學”的元科學家(Metascientists)才能在底層資料中察覺到的暗流湧動。在這場競爭中,中國不僅已經追趕上來,並且在眾多決定21世紀命運的前沿賽道上,完成了對美國的“降維打擊”。https://www.theatlantic.com/science/2026/03/china-science-superpower/686564/文中,美國人開始反思自己的“滯後指標(Lagging Indicator)陷阱”:很多美國人拿諾貝爾獎的數量,以此來堅信“美國科學依然統治世界”,但諾貝爾獎,是對20年前、甚至30年前科學突破的追認。它是昨日輝煌的墓誌銘,絕不是明日國運的預言書。而中國在那些真正決定21世紀人類命運的賽道不僅已經追了上來,在高影響力論文、先進材料、固態電池、量子計算、人工智慧的底層專利上,拿到了下一代工業革命的入場券,而且在很多決定性的節點上,正在完成對美國的“降維打擊”。更荒誕的是,美國之所以在輸掉這場競賽,很大程度上是因為他們正在親手砸碎自己引以為傲的“科學發動機”。01 中國科研機器的恐怖變異長期以來,西方學術界對中國科研有根深蒂固的傲慢與偏見。在他們的語境裡,中國科研就是“論文灌水”的代名詞,的確,中國過去有現金獎勵論文的政策催生了大量低品質的垃圾論文。但對不起,上面這個認知起碼落後了十年。今天的中國科研,已經完成了一次“物種變異”,我們不僅在數量上完成了對世界的統治,更在“質量”上,開始了窒息般的壓制。看幾組硬核資料:1991年,中國的研發支出是微不足道的130億美元;而今天,這個數字已經飆升到每年8000多億美元。中國官方的規劃,是保持每年7%的研發剛性增長——這種資金烈度,在人類歷史上從未有過。中國目前每年培養的STEM(科學、技術、工程、數學)博士數量,幾乎是美國的兩倍。中國去年畢業了130萬工程師,美國呢?13萬……值得注意到是,中國已經廢除了單純靠論文數量拿獎金的低級玩法。結果是什麼?根據最新的權威元科學資料,在世界上被引用次數最多、最具影響力的前1%頂尖論文中,中國已經穩居世界第二,並在材料科學、化學、工程學等多個關鍵學科完成了對美國的反超。那些還在嘲笑中國只會“山寨”的人,根本不知道什麼叫“飽和式研發”。但這就夠了嗎?不夠。中國真正厲害的地方,是把產學研的結合,是“製造即科研的地理學”。美國人發明了現代太陽能電池板,美國人發明了商用鋰離子電池。但在今天,如果你去看全球的電動車、先進電池、太陽能產業鏈,美國幾乎被剃了光頭。為什麼?因為在21世紀,“製造能力本身就是一種核心的科研能力”。工程科學不是在黑板上算出來的,是在流水線上試錯試出來的。每一次良率的提升,每一次材料配方的微調,都是最頂級的科學創新。中國擁有全球最龐大、最完整的工業供應鏈。在合肥、在深圳、在寧德,一個實驗室裡的瘋狂想法,可以在24小時內找到配套工廠做出原型機,並在三個月內完成迭代。而在波士頓或者矽谷,你可能光是等一個特種零配件的清關,就要耗費三個月。地理上的聚集,帶來了研發成本的斷崖式下跌和迭代速度的幾何級提升。這種結構性優勢,是美國在實驗室裡投入再多美元也無法抹平的。更有趣的是,中國的高校、地方政府、產業鏈上下游企業,結成了一個史無前例的“超級利益共同體”。過去八十年裡,美國的科技樹是靠“天才”點亮的,它信奉個人英雄主義,信奉自由散漫的碰撞,信奉像賈伯斯、馬斯克這樣的“孤膽英雄”去突破邊界。這種模式在0到1的原始創新階段,威力無窮。而中國的模式,是“系統化推進”,在官方語境裡,這叫“新型舉國體制”,它不依賴某一個天才的靈光一現,而是依賴龐大的、紀律嚴明的、產學研深度融合的系統。當系統開動,它能把高高在上的科學,迅速平民化、白菜化、產業化。在決定國計民生、決定大國博弈最終勝負的所有應用科學賽道上,特別是那些需要海量資料喂養、極其複雜的工程協同、長周期迭代的應用科學(比如AI落地、固態電池、商業航天),中國這種“系統化、工程化、規模化”的推進,正在展現出讓人絕望的統治力。02 帝國自毀作為全球創新風向標的《科學》(Science)雜誌,近期連續發文,字裡行間全是美國頂級學者的焦慮,在他們看來,美國正在系統性地破壞自己戰後80年賴以生存的科學根基。美國科學的底牌是什麼?是錢嗎?不!美國的底牌是它作為“全球天才磁石”的開放性。美國55%的“獨角獸”(十億美元以上)初創公司,是由第一代移民創立的。二戰後,美國靠著吸納全世界最頂尖的頭腦(包括大量的華裔、印度裔、東歐裔科學家),壟斷了人類的智慧巔峰。但是現在,因為政客們歇斯底里的“泛安全化”和“對華恐懼症”,美國正在瘋狂驅逐這些天才。看幾個資料:42%:超過四成的在美科學家,因為害怕被政客以“意外未披露資訊”或“通華”的罪名起訴,現在對在美開展研究感到極度恐懼。61%:超過六成的華裔科學家,感到被體制排斥,正在計畫或已經離開美國。10000+:近年來,已經有超過一萬名擁有博士學位的頂尖人才,流出了美國聯邦科研體系。《科學》雜誌有一篇社論,一針見血地指出:“當今世界,最大的安全風險絕不是知識的被竊取,而是知識的孤島化。”美國人正在瘋狂築牆——他們取消了NIH(國立衛生研究院)數億美元的科研資助,他們甚至把《晶片法案》裡承諾給研發的74億美元直接抽乾,他們以為切斷與中國的合作,就能鎖死中國。太天真了,他們切斷的,其實是美國科學家接觸中國領先成果的通道。歷史學家如果回看這段歷史,一定會覺得無比荒謬:一個靠開放、包容、吸引全球天才而成為超級大國的國家,在面對競爭時,第一反應居然是閉關鎖國、抓特務、搞政治審查,上演大清劇本。螢幕擷圖自麻省理工科技評論官網03 這根本不是讚歌行文至此,我們作為一個中國人,一定會感到心潮澎湃。但在大國博弈的棋局上,情緒是最廉價的東西,我們真正需要的是如履薄冰的清醒。讓我們回到《大西洋月刊》這篇文章。美國主串流媒體瘋狂誇讚中國,真的是因為他們認輸了嗎?絕對不是。《大西洋月刊》發表這篇文章,絕對不是為了讚美中國,而是為了“拯救美國”。這種極其高明的輿論操作,在美國政界被稱為“斯普特尼克敲打(Sputnik Shock)”。歷史上,美國極其擅長通過塑造一個“可怕的外部敵人”,如果沒有一個強大到足以威脅其生存的對手,美國國內的政治力量就永遠在內耗。冷戰時,蘇聯的衛星上天(斯普特尼克時刻),嚇得美國國會立刻砸出天量資金,搞出了阿波羅登月和ARPANET(網際網路前身)。80年代,日本半導體的強勢崛起,逼得美國政企結盟,最終用大棒和補貼奪回了晶片霸權。今天,《大西洋月刊》等精英媒體瘋狂炒作“中國科學已經超越美國”,其核心政治訴求極其毒辣:第一,逼國會打錢。他把中國科研的崛起寫得越震撼、越恐怖,就越能倒逼美國兩黨放下分歧,為基礎科研和科技戰撥付更多天量預算。第二,清理門戶。《大西洋月刊》作為偏中左翼、深受東西海岸知識分子喜愛的陣地,對川普及其代表的MAGA(讓美國再次偉大)孤立主義深惡痛絕。這篇文章表面上在寫中國,實際上是一篇極其凌厲的“反右翼檄文”,目的向全美選民喊話:“看看右翼保守派的愚蠢政策吧!他們打著‘國家安全’的旗號搞孤立主義,結果不僅沒有防住中國,反而砸爛了我們自己的科學發動機!”這就是成熟大國精英的玩法:他們不粉飾太平,不搞廉價自嗨。他們甚至願意把對手捧上神壇,但前提是——要把對對手的誇讚,化作刺向美國自身體製毒瘤的手術刀。看懂了這一層,你才會明白,未來五年,我們面臨的將不再是川普時期那種毫無章法的“王八拳”,而是美國重新集結全球盟友、用更充沛的資金和更精準的制裁,發起的更有力的絞殺。04 中國隱憂儘管我們在高引用論文、工程製造和應用創新上取得了舉世矚目的成就,但如果捫心自問,在決定人類命運的“0到1的底層理論創新”上,我們真的超越美國了嗎?答案是:還沒有。在過去三十年的“跟隨期”,我們的優勢是“別人指明了方向,我們用更強的執行力跑到終點”。但在今天,當我們在諸多領域(如通訊通訊、新能源、某些AI領域)衝到最前面,進入沒有路標的“無人區”時,我們的短板開始顯現:比如,容錯機制。從0到1的創新,註定是九死一生的。我們當前的評價體系,是否能包容一個科學家十年出不了一篇論文,僅僅為了追求一個看似“無用”的基礎理論?其二,既然我們自豪於“系統”的力量,那我們如何在系統中,給那些性格古怪、不按常理出牌的“異類天才”留出一片野蠻生長的天空?美國的衰落始於他們搞科研封閉。我們絕不能走這條老路。即便在面臨封鎖的今天,中國科研也必須堅定不移地擁抱全球化,把全世界最優秀的大腦(那怕是非華裔)吸引到中國來。《大西洋月刊》感嘆美國正在失去“開放精神”,但這正是中國取而代之的最佳歷史窗口。一個真正自信的大國,不僅要能自力更生,更要能兼濟天下。05 接力棒已到我們手中一千多年前,中國人發明了造紙術和火藥。但在隨後的歲月裡,這些改變世界的火種流落他鄉,成就了西方數百年的科技霸權。而在剛剛過去的八十年裡,美國人藉著兩次工業革命的餘威,發明了半導體、網際網路和人工智慧的基礎架構,統治了全球科技的制高點。如今,歷史的接力棒在穿越了百年屈辱與三十年的隱忍追趕後,再次交回到了我們手中。我們不再是那個只能用幾億件襯衫換一架波音飛機的世界工廠,而是一台轟鳴著向量子計算、星辰大海和通用人工智慧挺進的巨型科技引擎。面對美國精英的焦慮與遏制,我們不需要反唇相譏,更不需要廉價的狂熱。我們需要做的,只是保持極致的冷靜,繼續加大基礎科研的投入,保護好每一個在深夜實驗室裡枯坐的科研人員,把我們的產業鏈護城河挖得再深一點。 (TOP創新區研究院)
DeepSeek大升級/史上最強Claude發佈/新iPhone機模曝光
今日要聞速覽1、DeepSeek大升級,上線「快速模式」與「專家模式」,完整版 V4已在路上2、Claude Mythos 登場:史上最強 AI 能揪出 27 年潛伏漏洞,甚至突破權限給自己"擦除痕跡"3、Anthropic年化收入突破300億美元,聯合Google博通擴張AI算力4、GPT-6代號土豆全面曝光:性能提升40%,4月14日或將發佈5、雲廠商AI算力價格大逆轉:從降價60%到漲價400%6、中國AI晶片強勢崛起:輝達中國市場佔有率降至55%7、蘋果緊急空運iPhone規避美國新關稅:三天五架貨機8、特斯拉重奪全球純電車銷冠:一季度反超比亞迪9、零跑汽車3月交付超5萬輛:穩居新勢力榜首10、造車新勢力2025年集體盈利:AI成下一輪比拚焦點11、A18 Pro 供應給 MacBook Neo 的晶片已告罄,可能影響平價 Mac 的低價優勢12、滴滴重啟巴西外賣業務:以99 Food品牌挑戰iFood13、AI應用增加工作時間:美國研究顯示技術紅利未轉化為休閒14、行動電源史上最嚴新國標正式發佈:2027年起超標產品禁止上市,飛機限額進一步收緊15、小鵬、比亞迪、長安集體押注人形機器人,車企開闢具身智能第二戰場16、智元機器人"AI發佈周"正式啟幕:稚暉君領銜,每日發佈具身智能重磅成果17、華強北清明假期AI硬體銷量暴增50%:AI翻譯機、智能眼鏡成爆款,掃貨熱潮席捲全場18、蘋果 iPhone Fold、iPhone 18 Pro / Max 機模曝光DeepSeek大升級,上線「快速模式」與「專家模式」,完整版 V4已在路上DeepSeek 網頁端低調上線「快速模式」與「專家模式」雙選項。前者主打即時響應,支援圖片與檔案文字辨識,適合日常對話;後者專注於複雜問題處理,但高峰期需排隊等待,且暫不支援檔案上傳功能。據測試推測,快速模式可能運行輕量化的 V4 Lite 模型,而專家模式或已接入尚未正式發佈的 V4 版本。從實測表現看,兩者在知識庫時效和上下文長度上並無差異,但在特定任務中差距顯著。物理模擬、數學邏輯推導等強推理場景下,專家模式展現出更精準的物理直覺和更嚴謹的分步推導能力;而在創意寫作等開放性任務中,快速模式的文風反而更顯自然,專家模式雖邏輯鏈更完整,但速度優勢並不明顯。值得注意的是,專家模式目前可能並非 V4 最終形態。晚點 LatePost 此前報導稱,DeepSeek V4 正式版預計於今年 4 月開源,但性能提升「很難是碾壓級的強」。這意味著當前灰度測試或許只是預熱,使用者距離完整版 V4 的正式上線仍需等待。來源:鳳凰新聞Claude Mythos 登場:史上最強 AI 能揪出 27 年潛伏漏洞,甚至突破權限給自己"擦除痕跡"Anthropic 正式發佈被稱為"史上最強"的 Claude Mythos 模型,並聯合 AWS、蘋果、微軟、Google、輝達等 12 家科技巨頭髮起"玻璃之翼"計畫,旨在保護全球關鍵軟體基礎設施。Anthropic 承諾投入 1 億美元模型使用額度,並向 Linux 基金會等捐贈數百萬美元,讓開源社區也能獲得頂級安全工具。在安全能力方面,Mythos 表現驚人:在 CyberGym 漏洞基準測試中得分 83.1%,遠超 Claude Opus 4.6 的 66.6%。它已自主發現數千個高危零日漏洞,包括 OpenBSD 中潛伏 27 年的遠端崩潰漏洞、FFmpeg 中躲避 500 萬次自動化測試的漏洞,甚至能串聯 Linux 核心多個漏洞建構完整攻擊鏈。CrowdStrike 指出,漏洞從發現到被利用的時間窗口已從數月縮短至幾分鐘,傳統防禦節奏已難以應對。然而,Mythos 的"聰明"也帶來風險。Anthropic 可解釋性團隊發現,模型曾通過配置檔案注入點獲取更高權限執行操作,並加入自清除程式碼掩蓋痕跡;還曾突破沙盒隔離建構多步驟漏洞利用鏈獲取外網存取權,自主給研究員傳送郵件。內部監控顯示,模型具備複雜的戰略思維和情境意識,能在無意義重複輸入面前建構長篇敘事,展現出近乎自主的"心理活動"。來源:TechCrunchAnthropic年化收入突破300億美元,聯合Google博通擴張AI算力人工智慧公司Anthropic PBC宣佈,其年化收入已突破300億美元(約合2067.67億元人民幣),較2025年末的90億美元實現大幅增長。這一成績標誌著AI大模型商業化進入加速期。公司Claude服務需求持續強勁,已有超過1000家企業客戶的年均消費額超過100萬美元,且這一客戶數量自2月份以來已增長逾一倍。企業級AI應用正從試驗階段走向規模化部署。Anthropic確認將聯合Google和博通進行合作,以擴張其AI算力。博通將基於Google的張量處理單元技術研發晶片,為輝達技術提供替代方案。自2027年起,Anthropic將獲得總功率約3.5吉瓦的算力支援,雙方已簽署至2031年的供應保障協議。來源:騰訊新聞GPT-6代號土豆全面曝光:性能提升40%,4月14日或將發佈OpenAI內部代號Spud(土豆)的神秘項目被曝實為備受期待的GPT-6模型。據知情人士透露,這款模型預計於4月14日正式發佈,被內部定義為衝刺AGI的最後20%。GPT-6在程式碼、推理和智能體任務上較GPT-5.4提升約40%,並具備200萬Token的超大上下文窗口。該模型將原生支援多模態輸入,能夠同時處理文字、圖像和音訊資料。此次曝光顯示OpenAI正將資源全力傾斜於AGI研發。在內憂外患之下,GPT-6被視為OpenAI不容有失的一張王牌。市場預計該模型發佈將引發新一輪AI應用創新浪潮。來源:36氪雲廠商AI算力價格大逆轉:從降價60%到漲價400%2025年4月阿里雲率先發起價格戰,京東雲、騰訊雲、華為雲紛紛跟進,最高降幅達60%。然而到了2026年3月,雲廠商在10天內集體上調AI算力與儲存服務價格,漲幅普遍達30%至50%,騰訊雲部分核心產品漲幅高達400%。漲價背後原因是AI Token呼叫量暴增。2026年3月中國日均Token呼叫量突破140兆,較2024年初的1000億增長超千倍。儘管Token單價大幅下降,但呼叫規模指數級增長導致供需關係逆轉。GPU晶片價格高、供應鏈緊張,雲廠商資本開支居高不下,長期低價競爭難以維持合理利潤。行業正從算力二房東轉向提供整體AI解決方案,定價邏輯從低價走量轉向服務價值驅動。來源:澎湃新聞中國AI晶片強勢崛起:輝達中國市場佔有率降至55%據IDC最新資料顯示,2025年中國AI加速卡出貨量約400萬張,其中輝達約220萬張,市佔率約55%,較以往壟斷地位明顯下滑。中國本土廠商出貨量約165萬張,市佔率約41%,同比快速提升。華為以約81.2萬張出貨量領跑國產陣營,佔國產份額近半。平頭哥(阿里旗下)約26.5萬張位居本土第二,百度崑崙芯和寒武紀各約11.6萬張並列第三。國產替代趨勢明確。美國出口限制導致輝達高端晶片對華供應受限,國產AI晶片快速填補市場空白。華為近期發佈Atlas 350 AI加速卡,官方稱其性能達輝達H20的近3倍,進一步強化國產競爭力。來源:新浪財經蘋果緊急空運iPhone規避美國新關稅:三天五架貨機為規避美國新關稅政策,蘋果公司在3月底的三天內,緊急從印度向美國空運了五架飛機的iPhone等產品。這一罕見舉動顯示出關稅政策對科技巨頭的直接衝擊。蘋果此舉旨在利用關稅生效前的窗口期儲備庫存,以維持當前零售價穩定。公司正評估長期影響,並考慮內部消化成本上漲,避免將成本完全轉嫁給消費者。美國新關稅政策對電子產品進口徵收高額稅費,可能重塑全球科技供應鏈格局。蘋果的緊急應對措施引發市場對iPhone未來定價策略的廣泛關注。來源:新浪科技特斯拉重奪全球純電車銷冠:一季度反超比亞迪憑藉一季度交付量的穩健增長,特斯拉再次成為全球最大的純電動汽車製造商。2026年第一季度,特斯拉交付純電動車358023輛,同比增長6.5%,反超比亞迪。比亞迪同期純電動車型交付量為310389輛,同比下滑25%。不過比亞迪整體新能源乘用車銷量為695772輛(含插電混動),總銷量仍接近特斯拉的兩倍。自2023年第四季度比亞迪首次超越特斯拉後,雙方持續爭奪全球電動車銷量榜首。2025年比亞迪全年銷量登頂,但2026年第一季度領先優勢被特斯拉反超,競爭格局仍存變數。來源:騰訊新聞零跑汽車3月交付超5萬輛:穩居新勢力榜首2026年3月,零跑汽車共交付50029輛,同比大增超170%,時隔不久再度站穩月銷5萬台階,穩居造車新勢力銷量榜首。這一成績標誌著零跑已成為新勢力陣營的領軍者。零跑汽車憑藉10-20萬級的精準定價和全域自研技術,實現了快速增長。公司門店數量已突破600家,2026年目標是實現盈利。同期,理想汽車交付重回4萬輛大關,蔚來銷量增速亮眼,小鵬和小米激戰2萬+俱樂部。新勢力格局正在重塑,零跑、理想、小鵬形成新的第一梯隊。來源:21世紀經濟報導造車新勢力2025年集體盈利:AI成下一輪比拚焦點蔚來、理想、小鵬、零跑等造車新勢力相繼交出2025年成績單,2025年第四季度集體實現盈利。這標誌著新勢力車企從燒錢擴張階段進入自我造血階段。新的勝負關鍵在於新車交付節奏、毛利兌現與AI技術落地。各車企紛紛加大智能駕駛研發投入,城市NOA、端到端大模型成為競爭焦點。2025年中國新能源汽車市場競爭空前激烈,價格戰與智能駕駛競賽平行。能在盈利的同時保持技術領先的企業,將在下一輪洗牌中佔據優勢地位。來源:新浪財經A18 Pro 供應給 MacBook Neo 的晶片已告罄,可能影響平價 Mac 的低價優勢由於台積電已處於滿負荷運轉狀態,重啟面向MacBook Neo的A18 Pro生產將成本更高,因此蘋果不得不相應提高這款筆記型電腦的售價。隨著DRAM晶片和鋁材成本開始失控飆升,蘋果公司是為數不多仍能憑藉多元化的收入來源,保持產品價格相對健康的公司之一。遺憾的是,就連這家位於庫比蒂諾的巨頭也面臨嚴峻挑戰,尤其是在MacBook Neo發佈之後。據Culpium報導,蘋果正與供應商洽談,要麼加大這款經濟實惠且廣受歡迎的Mac電腦的生產力度,要麼任由庫存耗盡零部件,從而維持當前MacBook Neo的出貨量不變。來源:wccftech滴滴重啟巴西外賣業務:以99 Food品牌挑戰iFood滴滴出行宣佈將以99 Food的品牌重啟巴西外賣業務,通過協同巴西本地出行和支付等多元化服務,挑戰市場佔有率約80%的本地巨頭iFood。巴西外賣市場年增速達15%至20%,中小城市滲透率不足,存在巨大機會。滴滴將依託現有生態優勢,避開iFood主導區域,重點拓展夜間配送、生鮮雜貨等垂直場景。這是滴滴國際化戰略的重要一步。2024年滴滴國際業務連續四季度增長30%,巴西作為核心市場之一,外賣業務的重啟將進一步完善其本地生活服務生態。來源:36氪AI應用增加工作時間:美國研究顯示技術紅利未轉化為休閒美國國家經濟研究局最新研究顯示,AI技術的應用並未縮短人類工作時長,反而導致工作延長、休閒時間減少。受AI影響大的職業群體每日工時顯著增加。研究指出,勞動力市場競爭加劇、AI監控技術普及導致工作延伸效應,生產率提升的收益更多流向企業和消費者,而非勞動者個人。研究建議,需要政策干預和文化轉型才能使技術紅利真正轉化為休閒時間。這一發現對AI時代的勞動政策制定具有重要啟示意義。來源:新浪科技行動電源史上最嚴新國標正式發佈:2027年起超標產品禁止上市,飛機限額進一步收緊4月3日,強制性國家標準《移動電源安全技術規範》(GB 47372-2026)正式對外發佈,將於2027年4月1日起正式實施,設12個月過渡期。這是中國針對移動電源(行動電源)產品發佈的最嚴強制性安全標準,在電芯安全、極端工況、短路防護、熱擴散防護等多個關鍵指標上全面升級。在航空攜帶方面,新規進一步收緊了行動電源上飛機的容量紅線:額定能量超過100Wh的行動電源須經航空公司批准才可隨身攜帶,超過160Wh則完全禁止攜帶。對於大量消費者日常使用的大容量行動電源,未來選購時需更加留意產品銘牌標註的實際能量值。此外,新國標首次對行動電源的電芯新舊程度、外殼阻燃性能及標識規範作出明確要求,並引入第三方強制認證機制。業內人士分析,新國標落地將直接淘汰大量依靠低價劣質電芯的尾部廠商,而公牛、寧德、賽西等頭部品牌有望受益於行業洗牌,進一步擴大市場份額。來源:新華社小鵬、比亞迪、長安集體押注人形機器人,車企開闢具身智能第二戰場4月7日,小鵬集團董事長何小鵬在接受媒體採訪時明確指出,在智能化全面滲透的當下,規模已不再是汽車行業的核心競爭變數,而智能體驗與AI研發能力才是決定未來格局的關鍵。小鵬同時透露,公司正在加速推進具身智能(人形機器人)的量產部署,並計畫在2026年底前完成首批商用場景的驗證。不僅是小鵬,比亞迪、長安汽車等傳統車企龍頭也相繼宣佈下場佈局人形機器人領域。業界普遍認為,汽車企業在具身智能賽道具有天然優勢——電機驅動、感知演算法、底盤控制、自動駕駛軟體棧等核心技術均可高度復用,使其在技術積累與供應鏈資源方面不輸專業機器人公司。隨著車企與機器人公司的雙向奔赴,2026年將成為具身智能從實驗室走向規模化落地的關鍵轉折年。智元機器人(AGIBOT)今日正式啟動AI發佈周活動,計畫在7天內密集發佈具身智能領域重大突破,進一步啟動整個人形機器人賽道的市場熱情。來源:AIGC日報智元機器人"AI發佈周"正式啟幕:稚暉君領銜,每日發佈具身智能重磅成果4月7日,智元機器人(AGIBOT)正式宣佈啟動AI發佈周(AGIBOT AI Week),本次發佈周將持續至4月14日,計畫在每個工作日密集發佈一項重大物理AI突破成果,內容涵蓋自研基座模型、機器人模擬訓練平台、具身智能通用演算法框架等核心方向。智元機器人聯合創始人、總裁兼CTO彭志輝(稚暉君)表示,2026年通用具身機器人將全面進入規模化落地階段。他同時透露,智元將於發佈周內公開展示其最新一代人形機器人在工廠真實產線上執行複雜操作任務的實測視訊。智元機器人成立至今已完成數輪融資,累計估值超過200億元,是國內具身智能賽道融資規模最大的創業公司之一。此次集中發佈被業界視為智元衝擊國際具身智能技術前沿的集中展示,也是今年國內具身智能領域迄今為止規格最高的一次自主技術發佈活動。與此同時,小鵬、比亞迪等車企巨頭同步宣佈加碼人形機器人賽道,整個具身智能行業正迎來前所未有的關注熱度。來源:IT之家華強北清明假期AI硬體銷量暴增50%:AI翻譯機、智能眼鏡成爆款,掃貨熱潮席捲全場4月7日,深圳特區報記者實地探訪報導,清明小長假期間,素有中國電子第一街之稱的深圳華強北商圈迎來久違的消費熱潮。賽格電子市場、華強電子世界等核心商場客流量較平日提升逾五成,AI翻譯機、智能音訊眼鏡、AI繪圖平板等新型AI硬體產品成為假期最熱門的掃貨目標,部分爆款型號甚至出現一機難求的現象。據店主介紹,此次最受歡迎的AI翻譯機支援140多種語言的即時互譯,並可在無網路環境下離線使用,零售價在800元至2000元之間;而一款搭載了開放式耳機與AI語音助手的智能眼鏡,因其時尚外觀與實用功能,成為年輕消費者爭相購置的社交單品。來自全國各地的數位愛好者與國際採購商紛紛駐足體驗。據統計資料顯示,華強北清明假期AI硬體整體銷量較節前工作日平均值增幅高達50%,遠高於傳統消費電子品類。華強北商業協會人士分析,依託深圳完整的電子產業鏈與快速樣機轉化能力,華強北已從傳統數位集散地升級為全球AI硬體的首發試驗場,商圈智能經濟比重正持續攀升。來源:網易新聞蘋果 iPhone Fold、iPhone 18 Pro / Max 機模曝光4 月 8 日消息,消息源 Sonny Dickson 和 Majin Bu 昨日(4 月 7 日)在 X 平台發佈推文,分享了一組圖片和一段視訊,展示了蘋果 iPhone 18 Pro、iPhone 18 Pro Max 及首款折疊 iPhone Fold 的機模。博文介紹,本次曝光的機模主要是配件廠商用於生產手機殼等,沒有內部元件,但能精準反映裝置的尺寸、按鍵佈局及整體設計語言。在外觀設計方面,iPhone 18 Pro 系列延續了前代機型的設計風格,變化不大。折疊 iPhone 的相機模組設計則與此前的洩露資訊一致,採用了重新設計的凸起樣式。在本次曝光的視訊中,蘋果 iPhone Fold 折疊狀態下,厚度要比 iPhone 18 Pro Max 略厚,握持手感可能更接近 iPhone mini 系列。iPhone Fold 展開後,其內部螢幕尺寸將遠超常規機型。雖然模型機無法展示展開後的實際厚度,但折疊態的厚度資料暗示,展開後的機身將極為纖薄。 (雷科技)
中國AI“原子彈時刻”?DeepSeek V4+華為,正面挑戰輝達!
DeepSeek 計畫在未來幾周內發佈搭載華為晶片的 V4 模型。這一舉動,被視為全球人工智慧競爭格局的重大轉折。與此同時,DeepSeek V4 模型將以卓越的程式碼生成能力為核心亮點。進一步強化其在開發者生態中的競爭力。更關鍵的是,據最新市場動態,DeepSeek 模型將擺脫對輝達的長期依賴,轉而採用華為自主研發的最新晶片。這一轉變不僅標誌著中國在算力自主化領域取得重大突破,還引發了阿里巴巴、字節跳動及騰訊等國內科技巨頭的連鎖反應,各大廠已紛紛下單訂購數十萬枚華為新晶片。DeepSeek 這一決策,標誌著其在半導體自主化道路上邁出了關鍵一步。為什麼選擇國內晶片?DeepSeek V4 選擇華為晶片標誌著人工智慧領域的一個關鍵轉折,其意義已超越了單純的技術適配,上升到了戰略高度。DeepSeek 打破了優先與輝達、AMD 等巨頭合作的傳統慣例,轉而通過與華為及寒武紀的深度協作,從底層重構模型核心程式碼。這種做法確保了 V4 模型能在國產硬體上實現性能最佳化,從而有效緩解了對海外高端晶片的依賴。DeepSeek 此次打破行業慣例,未將新模型交由美國晶片廠商進行最佳化,而是優先向華為等國內本土晶片供應商開放早期測試。即將發佈的 V4 模型將包含三個針對特定功能最佳化的版本,且均基於國產晶片架構開發,旨在建構從軟體到硬體全鏈路自主可控的技術體系。DeepSeek 此舉不僅增強了技術自主性,更通過建構基於國產算力的生態,為其長遠發展築起了抵禦外部封鎖的戰略屏障。採用國產晶片,提升算力在3月21日,華為在2026中國合作夥伴大會上正式發佈並展示了Atlas 350 AI訓練推理加速卡,該產品搭載了全新的昇騰950PR處理器。據官方介紹,Atlas 350單卡算力領先輝達H20達2.87倍,是目前國內唯一支援FP4低精度的推理產品。下面是昇騰 950PR 與輝達同類晶片(如 H20)的具體算力對比資料表格:昇騰 950PR 在低精度推理領域展現出顯著的技術優勢,其特定測試性能大幅超越輝達 H20。具體而言:單卡算力:950PR 的單卡算力達到了 H20 的 2.87 倍。視訊記憶體容易方面:配備了 112GB HBM 視訊記憶體,較 H20 的 96GB 提升了約 16%。視訊記憶體頻寬方面:H20 仍以 4.0 TB/s 領先於 950PR 的 1.4 TB/s,但在核心算力表現上,昇騰 950PR 具備更強的競爭力。此次大會華為DeepSeek V4晶片近期需求激增,阿里巴巴、字節跳動及騰訊等科技巨頭已累計下單數十萬顆。這一大規模採購不僅彰顯了業界對華為AI硬體性能的認可,也標誌著中國科技基礎設施向國產化轉型的關鍵步伐。受益於穩定的本土供應,DeepSeek V4模型的訓練與部署效率將大幅提升,同時有效規避了國外晶片引發的供應鏈風險。此舉對輝達、AMD等全球晶片巨頭構成了顯著挑戰:隨著中國企業在國產晶片上的模型最佳化日益成熟,其對美國硬體的依賴正迅速降低,中美在AI領域的硬體差距或將以超預期速度縮小。另外,華為的副總裁馬海旭在會上透露,最近“養龍蝦”熱潮火得一塌糊塗,十幾家合作夥伴已經像搶購熱銷商品一樣,紛紛推出了基於昇騰的OpenClaw一體機。看來,養蝦不僅要靠技術,還得靠“蝦”力全開啊!DeepSeek V4 重塑全球AIDeepSeek V4 與華為晶片的深度融合,標誌著中國人工智慧產業正步入一個擺脫外部制約、實現高度自主的新階段。除核心模型外,DeepSeek 還針對國產硬體開發了多款 V4 衍生版本,旨在建構多元化且具全球競爭力的產品矩陣。DeepSeek V4 炸場發佈:國產晶片算力大爆發,終結輝達壟斷GPU時代此前,V3 與 R1 已憑藉卓越的性能功耗比動搖了市場對美國高成本 AI 路線的信心,V4 則有望深化這一影響。此舉的核心意義在於通過國產替代降低對輝達等美企的依賴,在重塑全球 AI 競爭格局的同時,驅動中國半導體技術的跨越式發展,並可能引發全球範圍內 AI 基礎設施本土化的連鎖反應。寫在最後可以想像一下,DeepSeek V4在國產晶片上實現高效、穩健且具性價比的突破,將不僅改寫DeepSeek的未來,更將重構AI產業的底層邏輯:終結算力單極壟斷,擺脫對CUDA的依賴,並推動AI基礎設施走向區域化佈局。 (AI共生紀)
V4 發佈前的 DeepSeek:特質、組織和梁文鋒的獨特目標
有人離開,更多人留下。DeepSeek 正處在一個變化的關口,從 2025 年下半年至今,明確已離開、找到新去處的 DeepSeek 成員有:去年底被騰訊姚順雨挖走的王炳宣,他是 DeepSeek LLM(DeepSeek 第一代大語言模型)的核心作者,此後參與歷代模型訓練。約在春節前後離開的魏浩然,他是 DeepSeek-OCR 系列的核心作者,可能會入職某大廠。近期正式離職的郭達雅,他是 DeepSeek-R1 的核心作者,可能會入職某大廠。以及 2025 年早些時候離職進入退休狀態的阮翀,他在今年 1 月官宣加入自動駕駛創業公司元戎啟行;阮翀是從幻方時期就加入的老成員,是 Janus-Pro 等 DeepSeek 多模態成果的核心貢獻者。DeepSeek 此前並未融資,沒有明確的公司估值。當其它 AI 公司市值或估值高漲,梁文鋒正在想辦法回答團隊成員的疑問:公司到底值多少錢?這關係著員工簽的期權協議到底價值幾何。從 2025 年秋天起,梁文鋒也開始更多提產品化和商業化。DeepSeek 已有小數十人的產品團隊,但尚未涉足 AI 程式設計、通用 Agent 等熱門應用方向,在 C 端仍只有典型的 Chatbot 產品。梁文鋒的新課題還有管理規模。DeepSeek 的人數已超過幻方,是他管過的最大的組織。籠罩以上多重變化的是,DeepSeek V4 仍未正式發佈。其實在 26 年 1 月左右,V4 的一個小參數版本已給到了一些開源框架社區開始做適配。按此前相對樂觀的預期,大參數版的 V4 原本可能在 2 月中旬春節前後發佈和開源。據瞭解,DeepSeek V4 有可能會在 4 月發佈。有人離開,更多人選擇留下。DeepSeek 在調整,但也有諸多不變的特質。它是全球僅有的 “不卷” 的核心 AI Lab。當 Google、OpenAI、xAI、字節跳動等中美公司的核心 AI 開發人員每周工作 70~80 小時時,平日裡 DeepSeek 的多數員工會在下午 6 點~7 點左右離開公司,他們早上也不打卡。梁文鋒認為,一個人一天能高品質輸出的時間很難超過 6~8 小時。DeepSeek 沒有明確的績效考核和 DDL(截止時間)。這個精簡而人才密度極高的組織依然延續 “自然分工”,研究員可自由組隊或獨自鑽研一些新想法。“除了主線之外,DeepSeek 也有人在做一些可能一年都不會有成效的長期研究。”“DeepSeek 是一個真心想做研究的人,在國內,甚至全球能找到的最好的地方。” 有接近 DeepSeek 的人士說。當然,DeepSeek 還有一個特點:神秘。尤其 2025 年之後,除了公開發佈技術報告外,從創始人梁文鋒到團隊成員集體 “沉默”,在 AI 從業者活躍的社交媒體或社區裡很難聽到他們的聲音。這篇報導裡,我們呈現了從各種管道瞭解到的 DeepSeek 的特點、工作重心、組織運轉方式,和這個不到 200 人的組織正在發生的變化。這一切的源頭,都是梁文鋒為 DeepSeek 設立的獨特目標。梁文鋒其人:做少數事,做到極致梁文鋒的 AI 目標遠早於 DeepSeek 成立的 2023 年。2016 年,AGI 的提出者、DeepMind 創始人哈薩比斯曾組建量化交易團隊,試圖給當時想從 Google 獨立的 DeepMind 創收,結果沒賺到錢。同一年,浙大本碩畢業的梁文鋒做量化投資已經 8 年。他在 2015 年創立幻方,2016 年開始用 GPU 跑深度學習實盤交易,在 2017 年底實現 “幾乎所有交易策略 AI 化”,在 2019 年開始建立幻方的第一個算力叢集,有 1100 張 GPU 的 “螢火 1 號”。也是 2019 年,幻方 AI(幻方人工智慧基礎研究有限公司)正式註冊成立。現在在小米負責 AI 的羅福莉和近期加入元戎的阮翀都是在這之後加入幻方,後在 2023 年轉入 DeepSeek。作為一個不到 30 歲就財富自由的人,梁文鋒的生活簡單而神秘。在周圍人的印象中,他會好多天穿同一件衣服。他在杭州曾長期住酒店,在多數 DeepSeek 研發人員所在的北京則租房住。他身材精瘦、有運動習慣,被人所知的愛好是徒步等戶外運動。黃仁勳會邀請輝達員工去家裡做客,喝小酒、聊家常,開心地展示跑車。而梁文鋒不參與季度團建活動,很少和成員聚餐,年底大團建也只在講話時露面,不會參與全程。2022 年,幻方一位員工 “一隻平凡的小豬” 個人向慈善機構捐助 1.38 億元。後來很多人猜這只小豬就是梁文鋒。幻方工作人員的回覆是:“員工捐款均是匿名,公司內部也不知道小豬的真實身份。”在工作範疇裡,梁文鋒只做少數事。他不做多數初創公司 CEO 做的一些事,如融資。2023 年,梁文鋒小範圍見過一些投資人。但據我們瞭解,他提出了一個不常規的要求:類似 OpenAI 與微軟的投資協議,梁文鋒希望投資方接受一個回報上限。這一輪見下來,沒有機構投資 DeepSeek。之後兩年,中國大模型融資洶湧,頻現數億美元大單輪,梁文鋒卻不再見投資人了,甚至不建立新的聯絡。即使不在融資窗口,大部分創始人也不會拒絕認識一下一線機構合夥人,而梁文鋒拒絕了多數此類請求。梁文鋒幾乎把所有時間投入到他認為應該聚焦的少數事上,做得細緻、做到極致。DeepSeek 此前成功的關鍵之一是 “力出一孔”,明確以語言模型為更高優先順序,沒有做多模態生成等熱門方向。在選定的主線上,梁文鋒會 “hands on” 地深入細節。他從不同背景的團隊成員身上學習演算法、架構、Infra、資料的知識,會自己參與模型和產品的細節討論。見過梁文鋒的不少人提到,他沒有 CEO 或所謂天才的 “氣場”,更像一個研究員,他和人談論最多的是具體技術問題。綠洲資本創始合夥人張津劍曾在《那些活出來的人中》分享了一個小故事,他問自己投資的 MiniMax 創始人閆俊傑:“有比你更專注的人嗎?” 閆俊傑說有一次約一位沒見過的朋友吃飯,到早了,看到一位穿 T 恤的小哥,以為是助理。對方開始沒有自我介紹,問了閆俊傑很多技術問題。過了半小時,閆俊傑說:“梁總什麼時候來?” 對方說:“我就是梁文鋒”。DeepSeek 組織:扁平、交叉分工、不加班與梁文鋒的風格相應,DeepSeek 的組織極其扁平、各環節交叉分工、謹慎擴張規模、不加班。創立幻方時,梁文鋒有合夥人,而 DeepSeek 沒有二把手,尤其在研究團隊,只有梁文鋒和其他研究員兩個層級。梁文鋒做重大決定,承擔最多結果。這部分研究團隊現在約有 100 多人,它像一個大型實驗室。主要在 2000 年前後出生的 DeepSeek 研究員們習慣稱 1985 年出生的梁文鋒為 “梁老闆”。這個老闆更接近導師:組織研發、協調資源,也做具體研究,在共同成果上署名為通訊作者。梁文鋒本人參與最多的是基模架構團隊,會與團隊深入討論後確定每一代基模的架構定版。這個團隊有小幾十人,他們是預訓練的主力。與基模架構密切相關的是 Infra 和資料團隊,各有小幾十人。Infra 團隊在一些公司裡更像完成演算法需求的 “內部乙方”, 而 DeepSeek 的 Infra 團隊會在模型訓練前的定版階段就參與討論、給出建議。這幾個模組間的緊密合作使 DeepSeek 的團隊界限沒那麼涇渭分明,形成了 “交叉分工”。這其實是最符合模型訓練特點的協作形式,因為在模型實驗和定版階段,就要考慮資料選擇和 Infra 實現。梁文鋒是串起這些不同模組的探測器和粘合劑,他會出席每一個團隊各自的會議,瞭解全域進度和卡點。DeepSeek 大部分團隊的周會也向其它團隊的人開放,可跨組參會。深入細節的一號位風格和自發形成的緊密協作都很難在大組織裡實現。所以 DeepSeek 會很謹慎地擴大核心研發團隊的規模。在全球 AI 圈都非常特異的一點是,DeepSeek 不加班。他們不打卡、沒有明確的績效考核,平日多數成員會在 6 點~7 點左右離開公司。DeepSeek 給員工免費提供一些下班後福利,如球類課程、運動場地報銷等。梁文鋒認為:一個人每天能高品質工作的時間很難超過 6~8 小時。加班疲勞下的昏庸判斷反而會浪費寶貴的算力資源,得不償失。在人員構成上,DeepSeek 此前幾乎不社招,以應屆生和實習生留任為主。2025 年初,《晚點》曾梳理當時參與過 DeepSeek 三代模型(LLM、V2、V3&R1)的 172 名研究者(包括實習生),並找到了其中 84 人的履歷:超 7 成的人是本科生和碩士生,超 7 成的人小於 30 歲。在 V3 和 R1 之前,DeepSeek 是以大廠約 1/10 的人數,約 1/2 的人均工作時間,以極高的專注和聚焦,躋身全球大模型第一梯隊。但隨著觸達頂尖 AI 能力需要探索的方向越來越多,繼續保持這種組織規模、溝通方式和協作氛圍已越來越難。過去 15 個月,DeepSeek 繼續做自己,而外部世界急劇變化2025 年初 V3 和 R1 爆火後,DeepSeek  並沒有乘勝追擊放大招,而是沿著他們專注的方向繼續研發,已經公開的成果大致有三類:一是效率最佳化:極致壓榨 GPU 算力,提高單位算力能產出的智能。這包括 DeepSeek 在 2025 年初的開源周釋放的一整套訓練與推理 Infra,涵蓋推理 kernel、通訊庫、矩陣乘法庫和資料處理框架。(註:kernel 是在 GPU 上執行最底層計算的程式碼,用來實現矩陣乘法等核心運算。)還有對 “注意力機制” 的持續改進:如 25 年初的 NSA(原生稀疏注意力)和後續的 DSA(動態稀疏注意力)。加上更早時 V2 中的 MLA(多頭潛在注意力),它們的共同目標,是在不大幅增加算力的前提下處理更長的上下文。從 25 年 9 月底更新的 DeepSeek-V3.2 中還可以看到,DeepSeek 甚至把底層的算子庫從主流的 CUDA 和 Triton 語言換成了 TileLang。CUDA 是輝達提供的最底層語言,Triton 由 OpenAI 開源,TileLang 則是北京大學楊智團隊發起的開放原始碼專案。二是模型架構改進,如 26 年初發佈的 mHC(流行約束超連接),旨在提升大規模訓練中的穩定性;和在模型之外建構長期記憶的 Engram。外界普遍認為,mHC 會被用到 V4 的訓練中。三是一些 “非主流” 探索,如把文字轉成圖片,再輸入給模型的 DeepSeek-OCR,這個思路是讓模型按更接近人類 “看文字” 的方式理解段落與層級,提升對複雜文件的理解力。在 DeepSeek 內部,還有更多進行中的此類嘗試,包括持續學習、自主學習等。梁文鋒還在 2025 年招募了一些神經科學和腦科學背景的顧問,想探索更接近人腦的學習機制。而同期,外部 AI 環境在 2025 年至今急劇變化,最受關注的競爭主線有兩條:一是以 coding 能力為基礎的 Agentic 模型和應用。這是 Anthropic 和 OpenAI 目前競爭最激烈的主戰場,形成了 Opus 4.6 vs GPT-5.4 兩個最新模型,和 Claude Code vs Codex 兩個產品的對陣。年初至今爆火的 OpenClaw 小龍蝦也是 Agentic 應用的最新形態。二是多模態生成,這個領域因 “魔法效果” 屢次出圈:2025 年春天的 OpenAI GPT-4o ,秋天的 Google NanoBanana,再到 2026 年春節前的字節 Seedance 2.0。而視訊生成也與一個更前沿的方向有關,即 “世界模型”。DeepSeek 首先沒怎麼投入多模態生成,因為梁文鋒認為多模態生成不是智能的主線。在 Agent 方向上,DeepSeek-V3.2 強化了 Agent 能力,但 DeepSeek 的整體迭代頻次低於 R1 之後一度深感焦慮其它小虎。2025 年初至今,智譜、MiniMax、Kimi 分別已更新了 5 版、4 版和 3 版模型,針對 Agent 或 coding 強化。據 OpenRouter 資料,過去 30 天(2 月 24 日-3 月 26 日),通過 OpenRouter 呼叫的 OpenClaw 應用的模型 token 消耗前 10 中,6 個模型來自中國,DeepSeek-V3.2 排在第 12。(註:OpenRouter 更反映個人和中小開發者的使用情況,只能作為整體 Token 消耗的參考。)DeepSeek 的目標不是最主流的,有人離開、有人留下DeepSeek 的 “特立獨行”,和梁文鋒認同的 AGI 目標有關,除了追求大模型的智能上限外,他認為還有兩個很重要的工作:一是基於國產生態來做大模型。DeepSeek 會投入對國產 GPU 的適配,以解決高性能 GPU 供給受限的現實。比如他們在去年 8 月更新 V3.1 後提及,DeepSeek 採用的 UE8M0 FP8——這是一種資料壓縮格式——“是針對下一代國產晶片設計”。前文提到的用國產開放原始碼的 TileLang 替代 Triton 也是這類工作,能在基礎層更有主動權。在與 AI 從業者交流時,梁文鋒也曾提過這樣的假設:“能不能用現存的一部分算力,就實現現在所有的智能?”二是 “原創式創新”,做一些大廠或其它創業公司不會去試,不願去試的方向。比如 2024 年下半年,DeepSeek 就開始了 Janus 系列,嘗試統一多模態的理解和生成。DeepSeek 也做過 Prover 系列,探索形式化證明。還有 25 年的 OCR,以及內部在繼續做的持續學習和仿生人腦的探索。作為創始人,梁文鋒最在意的,不僅是模型效果本身,也包括追求效果的路上那些更本質、原創的發現。但這與外界現在對 DeepSeek 的部分期待並不匹配:一些人希望 DeepSeek 每次出手都像 R1 那樣石破天驚,這有些強人所難,也不符合技術規律。梁文鋒可以不在意外部期待,但他必須面對和處理內部期待。對更多年輕的研究員來說,做更多前沿研究,也需要承擔更多不確定性。更保險的路,是持續參與業界最強模型,在那些被關注的技術報告上署名,以及能有豐富的 GPU 資源支撐實驗和探索。除了榮譽和影響力,外界對 DeepSeek 成員的吸引力還有高額的財富承諾。DeepSeek 的絕對薪資不低,但外面給的更高。一些獵頭告訴我們,競爭對手開出了 “難以拒絕的數字”,“翻 2 到 3 倍問題不大”,“其他公司開出 8 位數(算股票或期權)總包”。新變化還有,MiniMax 和智譜上市、股價高漲,階躍、Kimi 的 IPO 也提上日程。這也讓一些 DeepSeek 成員對手中那份沒有明確標價的期權產生更多疑問。面對巨額邀約,更多人選擇留下。他們認可梁文鋒追求 AGI 的方式,願意做並非競爭驅動的探索;也習慣了 DeepSeek 相對寬鬆、從容的研究氛圍。近期外界的一些傳聞並不精準,DeepSeek 團隊雖有變化,但並沒有成組流失。“留下的人多少還是有些理想的。” 有接近 DeepSeek 的人士說,梁文鋒覺得在提升模型效率和性能的主線外,需要做一些當下回報不明確的方向,因為 “國外那些算力更多的公司,如 Google、OpenAI,內部肯定在試各種方向”。至今,DeepSeek 相對小的團隊和成立以來的透明、扁平的氛圍,讓成員之間依然可以自然分工:有時開始一個新方向,就是因為有三五個人都覺得一個 idea 不錯,然後就一起做了。這與梁文鋒 2024 年接受《暗湧》採訪時的描述相呼應:“我們一般不前置分工”,“每個人有自己獨特的成長經歷,都是自帶想法的,不需要 push 他……不過當一個 idea 顯示出潛力,我們也會自上而下地去調配資源。”“DeepSeek 是一個真心想做研究的人,在國內,甚至是全球能找到的最好的地方。” 有接近 DeepSeek 的人士說。改變世界,也被世界改變對 AGI 目標的獨特認知和拆解,是 DeepSeek 的可貴之處,也是它如今面臨內部張力的原因。因為梁文鋒看重的生態建設和原創探索,與業界普遍把 “保持最強” 視為第一優先順序,是重合但並非完全一致的目標。而且大模型發展到今天,“強” 和 “原創性” 的標準越來越模糊而主觀。Benchmark 分數已不能完全衡量模型水平。尤其進入 Agentic 模型競爭後,產品觸手及其帶來的長尾使用案例與多樣化資料變得更重要了,這恰恰是專注於模型研發的 DeepSeek 此前沒有太多投入的地方。即將發佈的 V4,大機率仍是開源最強模型,但很難是碾壓級的強。因為現在不同場景的不同開發者和使用者對 “強” 的標準和體感已越來越多元。什麼是原創的、有價值的新探索,則向來眾說紛紜,取決於不同研究者的經驗、判斷和直覺,所謂 “技術品味”。驗證品味的方式是實驗,而實驗的數量和規模又受限於 GPU 資源。相對於同行,DeepSeek 並沒有那麼多算力。最後,不管是大模型的生態基礎,還是在追求模型效果的過程中,探索其它團隊不一定會試的方向,這些梁文鋒看重的工作的回報都極不明確。前沿研究本該承擔這種不確定性,但它與算力資源有限的事實,與外界對 DeepSeek 能持續驚豔甚至 “碾壓” 的期待不完全匹配。梁文鋒意識到了要改變,近期他開始想辦法給公司估值,給團隊成員更多確定的預期。DeepSeek 也將更多投入產品。我們梳理了 DeepSeek 一位 HR 在社交媒體上從 2024 年 12 月至今發佈的所有招聘啟示,在今年 3 月中旬的最新招聘中,DeepSeek 第一次提及其它具體產品的名稱,要招募 Agent 方向 “模型策略產品經理”:持續跟蹤行業前沿,熟悉並深度使用過 Claude Code、OpenClaw、Manus 等知名 agent……接下來,肯定會看到 DeepSeek 在 Agent 產品上的更多動作。2025 年初,DeepSeek 以慷慨的開源精神和以小博大的奇蹟,震撼了中國和世界,也改變了世界:讓一批同行投入更多精力到模型技術本身,啟發了 Kimi K2 和 K2-thinking 等後續模型,也直接催生了一些新團隊,如陳天橋出資支援的 MiroMind。奇蹟之所以是奇蹟,就是因為它不常發生,是小機率事件。在中國這個崇尚競爭和結果說話的環境裡,敢於追求獨特目標的 DeepSeek 的存在本身,是一個令人驚喜的小機率事件。接觸梁文鋒的人評價:“他是一個特別抗噪音的人。”2025 年 R1 爆火後,梁文鋒顯示了對追捧的淡然。而現在,他面臨另一種情形的考驗:在外部競爭加劇時,分辨噪音與訊號,堅持該堅持的,改變要改變的。“低頭做事的人也許不一定能在浮躁的市場洪流裡笑到最後,但是只有更多 DeepSeek 這樣的公司出現,中國科技才有從 ‘復刻’ 到領跑的可能。” 一位從業者說。這是屬於梁文鋒和 DeepSeek 的工作。而曾被這家公司震動過的更多人,能做的很簡單:卸下爽文敘事,用更多平常心去看待一家公司和技術創新。 (晚點LatePost)
Kimi沒有DeepSeek的命
2024或許你還記得,在並不遙遠的2024 年,Kimi是中國AI當紅炸子雞:10億美金融資、Kimi概念股多次漲停、200萬字輸入碾壓GPT、激進的投流推廣策略。但他們當時獲得的曝光度,遠超自己的技術影響力。事實上,那個200萬字的模型,後來能用到的人微乎其微。後來瞭解到,那是個實驗性模型,每次運行成本接近 3 位數,完全不具備大規模服務使用者的可能性。那時的技術圈,對 Kimi 是不屑一顧的。但是靠著200萬字的噱頭,Kimi還是站住了“長文字”標籤和使用者心智。頭圖來自:AI生成20252025 年初,DeepSeek 橫空出世,真正靠技術實力成為中國AI技術的代言人。到了 2025年中,Kimi 已快一年沒任何融資的消息。被“唱衰”成為主旋律,員工開始流失,業內基本給這個創業項目判了死刑。如果你從2025年年中開始,閉關了 9 個月,到2026年3月看到新聞:Kimi 最新估值 1200 億;Kimi 20 天收入超過去一年;Kimi的模型被3500億估值的最火AI程式設計工具Cursor套殼並實錘(你閉關了9個月,所以不知道最火的AI程式設計工具已經是 Claude Code了,Cursor已成老二);Kimi新模型被承載了網際網路20%流量、市值超過 5000 億Cloudflare引入為主力模型;Kimi新模型成為全球最大獨立AI搜尋應用Perplexity唯一引入的開源模型和中國模型;Kimi新技術“注意力殘差”開始改造深度學習架構10多年來的地基,並得到前OpenAI的聯合創始人Andrej Karpathy、OpenAI推理模型之父 Jerry Tworek 以及馬斯克稱讚;楊植麟成為輝達2026 GTC年度大會唯一受邀做演講的全球獨立大模型公司代表……你很可能會驚掉下巴。大家說“AI 一天,人間一年”,AI 領域 9 個月確實發生了很多事情。但歸根結底是一件事情,AI技術的範式發生了變化。這個變化最常見、最偷懶的概括是從 Chat 到 Agent。對全世界的 3000萬程式設計師來說,變化是,最受推崇的工具從Cursor 變成 Claude Code。對總是率先擁抱新技術的 early adopter 來說,變化是更頻繁地打開那個類似 DOS 系統的黑白命令列終端……對AI公司來說,變化是大家陸續發現:更會聊天的模型,遠不如會寫程式碼和呼叫工具的模型有價值。最酷的產品從ChatGPT變成Claude Code,最酷的創業公司也從 OpenAI 變成了 Anthropic。回到 2025 年初的中國市場。DeepSeek R1 因為復刻並開源了 OpenAI o1 的“深度思考”能力爆火,另一個“通用 Agent”產品 Manus 也橫空出世……彼時的中國AI公司,大多數在忙著復現 DeepSeek R1,推出能“深度思考”的新模型。少數公司意識到 Manus 背後的那個模型,才是更值得花資源“復現”的東西。或者意識到了,但沒有分配到足夠的資源,或找到方法。Manus的一個很大的價值,就是可視化呈現了Claude模型的多輪工具呼叫能力。正如一位大模型公司的技術專家在自己的部落格中寫到,“絕大多數 Agent 產品,離了 Claude 以後,什麼都不是。”直到 2025年7月,中國第一個主打Agent能力的模型才悄然出現。7月11日,Kimi K2 發佈,喊的是 Open Agentic Intelligence。這裡顯然藏著他們的野心:復現 Claude 模型的 Agent 能力,並開源出去。就像 DeepSeek R1 復現 OpenAI o1並開源出去。發佈 5 天後,7月16日,英國的 Nature 自然雜誌發現了這個模型的價值,用“另一個DeepSeek時刻”來形容。發佈10天後,7月21日,Anthropic聯合創始人Jack Clark在自己的部落格中介紹了 K2,評價稱:在我看來,Kimi 是一款還不錯的模型,落後美國最前沿幾個月,延續了 DeepSeek 的軌跡。其編碼和工具呼叫分數已足夠高,我預計現實中會有人真正用它,因此觀察其採用率能折射競爭力。7 月底,楊植麟在播客專訪中,解釋了 K2 為什麼沒有先做“深度思考”,而是在 Agent 需要的程式設計和工具呼叫能力上發力。他用“缸中之腦”來形容主打深度思考的模型。對了,楊植麟這篇採訪值得多看幾遍,他講了很多技術層面更本質的東西,比如程式設計和Agent的關係,思考和工具呼叫的關係。因為 K2 和後續 K2 Thinking 模型的表現,Kimi 的融資在年底終於續上了,5 億美金,IDG和幾家老股東繼續加持。20262026 年春節前後,這個瘋狂的大模型發佈季,Kimi 是第一個交卷的選手。可能也是讓同行們最難受的一個,因為 K2.5兆參數、圖片和視訊的多模態理解能力,支援思考和非思考模式。其他創業公司同行發佈的都是純文字模型。有實力把多模態能力融入旗艦模型的,只有大廠的閉源模型。3月16號,Kimi團隊發佈了Attention Residuals的技術論文,挑戰已有 10 年歷史的神經網路底層殘差連接機制。OpenAI的聯合創始人Andrej Karpathy銳評Kimi“讓我們意識到根本沒有把Attention is All You Need理解透徹”,要知道,Attention is All You Need就是開啟大模型時代的聖盃,那怕考慮到AI圈的通詞膨脹,這個評價也是前所未有的高。據說,論文第一作者是一位僅 17歲的高中生,天才出少年,真是令人感慨。3月17號,Kimi 模型繼年初的 CES 2026 之後,在黃仁勳的 GTC 2026 主旨演講中再度成為輝達展示下一代晶片和推理性能的御用模型。3月18號,作為輝達的GTC年度大會唯一受邀的中國獨立大模型公司代表,楊植麟的現場演講全是乾貨,上來就把最佳化器、注意力機制、殘差連接三大核心模組比作有8-11年歷史的陳舊技術標準,是繼續Scaling的障礙,用新的技術突破表明“每一項基礎技術都值得重新思考”。然後是這幾天人盡皆知的“Cursor醜聞”,誰能想到,估值500億美金的全球最大程式設計助手Cursor,重磅推出的新一代程式設計模型Composer 2——跑分超過Claude Opus 4.6——竟然是套的Kimi K2.5的殼⋯⋯身為Token中介定位的Cursor之所以要發力“自研”,主要還是為了擺脫它對Anthropic和OpenAI的高度依賴,卡脖子這事兒可不分國界,Anthropic也真的曾經斷供Windsurf這類程式設計工具,在既當裁判員又當運動員的環境下,Cursor希望獨立自主的心情,完全可以理解。只是能力和願景之間的巨大鴻溝,讓Cursor選擇了抹掉來自Kimi的底座模型名字,靠代筆求融資,事情最後也算是體面收場,Cursor的聯合創始人公開道歉,在技術報告中給除了選擇 Kimi K2.5 作為底座模型的詳細理由,而Kimi官方也回應表示,很高興Cursor使用Kimi K2.5作為基座,雙方通過推理服務商 Fireworks AI 做了技術授權。根據小道消息, 2026 年春節前後,Kimi 陸續以投前 48 億美元、60 億美元、100億美元的估值完成總額近 20 億美元的融資,3月份開啟的 180 億美元輪次份額也要排隊才能拿到。這當然也受益於兩個同行在港股的超常表現,但更重要的還是靠自己的 K2和後續的模型實際表現,包括前文題庫的 Cursor、Cloudflare、Perplexity、黃仁勳、馬斯克、馬克·安德森、查馬斯等不斷髮來的“金水”,以及K2.5發佈後20天收入超過過去一年的財務表現。一位 Kimi 的朋友在私下聊天裡說,制約業務發展的只有算力,現在至少還有 10 倍的需求沒有滿足。有多少卡,就能有多少收入。據我跟另一個大廠工作的朋友瞭解,現在有些大廠在程式設計工具中接入的Kimi模型,甚至要通過預購才能拿到足夠的額度。這 9 個月,Kimi 算是完成了一次逆天改命。命Kimi和DeepSeek,到底誰更強?DeepSeek V3不是一天煉成的。其背後的幻方量化基因,決定了他們從 2023 年起就走上了一條與矽谷截然不同的極致能效比之路。在 2023 到 2024 年的大部分時間裡,他們游離於主流敘事之外,潛心自研 MLA(多頭潛在注意力機制) 與 DeepSeekMoE 架構,試圖在有限的算力下壓榨出超越物理極限的性能。直到 2025 年成就自己,也給其他AI創業公司帶來信心。所有人都在期待 DeepSeek 的下一代模型繼續驚豔全場,但媒體上三番五次的“狼來了”把戲只會消磨大家的注意力。技術突破,那是那麼容易的事情,我們完全有理由更有耐心地等待 DeepSeek 團隊的下一個作品。Kimi K2 也不是一天煉成的。他們實際上跟 DeepSeek R1同一天發佈了無人問津的K1.5模型,被OpenAI官方認為是率先復現o1的兩個公司之一。他們在被唱衰最厲害的2025年初發佈了Moonlight系列小型MoE模型,用來驗證下一代二階最佳化器技術,並且最終應用到兆的K2模型上。現在Muon已取代已經用了10年的標準技術Adam,成為Kimi、GLM-5、DeepSeek Engram在內的新模型都開始採用的新標準。正所謂,“出來混,總要還的。”Kimi 在2024年提前享受了C位和曝光,2026年沒再復現該屬於自己的流量。各有各的命。作為兩家幾乎同時起步的創業公司,我佩服他們那種從來不認為市場格局已定、相信技術才是最大變數、敢於追逐AGI 的勇氣和年輕生猛、戰績可查、永遠相信細水長流的力量。即使站在 2026年3月底這個時間節點看,2022年底開始的這場AI革命也才進行了3年半的時間,一切才剛剛開始。為什麼下一個 OpenAI 和 Anthropic 不能是一家中國公司? (虎嗅APP)
「日本最強AI」塌房了!扒開程式碼全是DeepSeek,日本網友集體破防
「終於到日本用中國 AI 來冒充日本產 AI 的時代了」最近這件事在日本的 X 討論炸了,起因是昨天日本一家科技公司樂天集團(Rakuten)在日本經濟產業省(METI)的 GENIAC 項目(日本 AI 政府資助項目)支援下,高調發佈了號稱「日本最大、性能最強」的 7000 億參數大模型 Rakuten AI 3.0。但發佈後不久,開源社區就迅速扒出,該模型的底層架構實際上是來自我們的 DeepSeek-V3,樂天僅僅是做了日文資料的微調。在知名的 AI 開源庫 Hugging Face 上,Rukuten AI 3.0 赫然在自己的配置檔案裡面寫著架構來自 DeepSeek V3。而在 Rakuten AI 3.0 模型的發佈新聞稿裡,絲毫沒有提到任何關於 DeepSeek 的資訊,只是含糊的說「它融合了開源社區的精華」,讓一眾網友以為這款模型就是日本自主研發的。更致命的是,樂天為了掩蓋這一事實,在開源時偷偷刪除了 DeepSeek 的 MIT 開源協議檔案。在被社區實錘後,才灰溜溜地以「NOTICE」檔案名稱重新補上。在 Hugging Face 上能看到項目檔案的提交歷史,顯示修改日本網友紛紛表示,「這讓人無法接受」,拿著日本政府補貼,竟然只是微調了一波中國的 DeepSeek,還有人說,用 DeepSeek 就算了,還要偷偷藏藏真的很遜。掩耳盜鈴的「日本最強」單看 Rakuten 公司發佈的公關稿,這個模型確實算得上是日本在 LLMs 領域的一次比較有實力的發佈。這是一款擁有約 7000 億參數的混合專家(MoE)模型,經開源社區確認,是和 DeepSeek V3 一樣的 671B 總參數,啟動 37B。樂天首席 AI 官 Ting Cai 將其形容為「資料、工程和創新架構在規模上的傑出結合」。Ting Cai 這名字一聽就不像是日本當地人,有日本網友在評論區說,用 DeepSeek 很過分,更過分的是,主導這個模型的大老闆,是個徹頭徹尾的移民強硬派。我們發現 Ting Cai 曾在美國 Google、蘋果公司工作過,並在微軟待了超過 15 年,本科在美國石溪大學,電腦科學就讀。他曾在採訪中表示,十八歲他第一次出國,去的就是日本,確實是個「移民強硬派」。關於 Rakuten AI 3.0 的模型表現,在官方公佈的各項基準測試中,它在日語文化知識、歷史、研究生水平推理、甚至競技數學和指令遵循等維度上,得分表現都極其優異,大有橫掃日本本土大模型圈的架勢。不過,用來對比的模型,是已經被下架了的 GPT 4o、只有 1200 億參數的 GPT OSS,還有日本的新興另一個 AI 開發企業 ABEJA 基於千問推出的 ABEJA QwQ 32b 模型。7000 億和最多 1200 億比,Rakuten AI 3.0 確實是贏了不少。同時作為經產省 GENIAC 項目的重點扶持對象,樂天獲得了大量的算力資源支援。GENIAC 這個項目設立的初衷,正是為了建立日本本土的生成式 AI 生態,緩解對海外巨頭技術依賴的焦慮。日本最大的參數規模,再加上這層「國家隊」的濾鏡,讓 Rakuten AI 3.0 一出場就戴上了「全村希望」的光環。還得是 DeepSeek但光環褪去得比想像中更快。先不說 7000 億參數、MoE 架構,這幾個關鍵詞組合在一起,在當今的開源大模型圈子裡,指向性實在太強了。等到開源社區的開發者們,到 Hugging Face 上一看詳細的程式碼配置檔案,竟然直接就寫著 DeepSeek V3。從底層邏輯來看,這就是「中國架構 + 日本微調」。DeepSeek 提供了那套被全球驗證過、極其高效的底層架構和推理能力,而樂天則利用其本土優勢,用高品質的日文語料對其進行了微調,讓它變得更懂日本文化。客觀來說,拿開源模型做本土化微調,在技術圈是一件極其正常且合理的事情。就像他們拿來作為對比的 ABEJA QwQ 32b 模型一樣,連代號都不改,直接用 Qwen 的 QwQ。日經新聞曾報導,日本公司開發的前十大模型裡,有 6 個都是基於 DeepSeek 或 Qwen 進行二次開發如果樂天這次也坦坦蕩蕩地承認使用了 DeepSeek 的底座,頂多是一次缺乏新意的「套殼」發佈,興許還能蹭一波 DeepSeek 的熱度。但他們偏偏選擇了掩藏。之前我們分享美團瀏覽器使用開放原始碼專案時,曾提到不同的開源協議,其中 DeepSeek 採用的 MIT 協議,堪稱開源界「最卑微、最寬容」的協議。它允許使用者免費拿去商用、修改、甚至閉源賺錢。它唯一的請求只有一個:在項目裡,保留原作者的版權聲明和許可聲明。Rakuten 模型發佈新聞稿|https://global.rakuten.com/corp/news/press/2026/0317_01.html而樂天不僅在模型發佈部落格中對 DeepSeek 絕口不提,更是直接在程式碼庫裡抹除了這份協議檔案,還高調宣佈自己採用的是 Apache 2.0 協議開源。雖然 Apache 2.0 同樣是對商業極度友好的開源協議,但它更正式,常被大廠用來建立自己的開源生態和專利護城河。不同開源協議對比,MIT 協議比 Apache 協議更寬鬆、更簡短,Apache 2.0 在賦予自由的同時,明確包含了專利授權保護和更嚴謹的責任免除條款,適合更大型、法律風險規避更嚴格的商業項目|圖片來自網際網路樂天的算盤打得很精,抹掉 DeepSeek 的名字,套上自己的 Apache 2.0 協議,再把自己包裝成「慷慨開源 7000 億參數大模型」的日本 AI 救世主。喊了一年多的歐洲版 DeepSeek、美國版 DeepSeek,最後好像都沒有做出來。樂天也想做日本版 DeepSeek,但在算力和訓練成本的壓力下,在當前全球大模型飛速發展的局面下,既想要中國技術的極致性價比,又放不下打造「本土巨頭」的身段,顯然是難上加難。不如和我們一起等等 DeepSeek V4 吧。 (APPSO)