#DEEPSEEK
矽谷開始反向借鑑中國AI
如何讓AI不再只是聰明的“玩具”?誰能想到,作為全球科技風向標的矽谷巨頭們,如今也得向中國AI的技術文件“取經”呢?在全球開源社區GitHub平台上,阿里千問(Qwen)、DeepSeek等中國開放原始碼專案的關注度持續走高,Meta、愛彼迎(Airbnb)等矽谷大廠,也紛紛將中國AI的技術架構納入研發視野。“矽谷輸出、全球承接”,過去數十年形成的這種單向技術流動格局,正發生逆轉。據第三方機構統計,過去一年,80%的全球AI開源初創企業採用了中國模型;阿里千問衍生模型長期位居頭部;DeepSeek位列全球主流模型第9名。這場始於程式碼共享的產業重構,重塑了全球AI競爭的底層邏輯,並推動行業從技術壟斷走向多元協同。告別了狂熱比拚參數規模的“軍備競賽”,中國科技企業走出了一條風格鮮明的差異化道路——依託開源與生態,追求落地和務實。如阿里巴巴集團副總裁、阿里千問C端事業群總裁吳嘉近期所言,AI在擁有超強大腦之後,現在要開始長出能觸達真實世界的手和腳,在生活中實實在在地替使用者“幹活”。千問上線“辦事”功能,就是這一理念的實證。靠著阿里全生態的加持,它不止停留在對話層面,而是“一說需求就落地”,有效破解了AI落地難的痛點。這種“實用為王”的創新邏輯,不僅吸引了矽谷巨頭的注意,也標誌著全球科技圈進入多元共生、互相成就的新階段。產業變局背後,我們更想追問:中國AI實現原創性突破的核心密碼是什麼?AI時代,一款真正“好用”的智能助手,究竟要具備那些關鍵特質?在解決本土產業痛點的過程中,中國AI企業積累了那些獨特優勢?如何讓AI擺脫“玩具屬性”,成為真正能落地幹活的得力幫手?01 告別“參數競賽”,聚焦“能力密度”三年前,全球科技界都在比拚一個數字:模型參數,中國企業一度被迫跟隨這場“燒錢”遊戲。據第三方測算,一次完整的GPT-4對話消耗的算力成本,相當於普通搜尋引擎查詢的10倍以上,這也使得大模型技術難以真正落地到普通使用者場景中。直到2025年,Nature子刊發表《Densing Law of LLMs》(大語言模型的密度定律)一文。該研究提出的“能力密度”概念,顛覆了傳統評價體系,標誌著大模型發展從拼“規模”正式轉向拼“效率”,這一趨勢與中國AI企業的探索不謀而合。來源:AI生成中國AI企業率先跳出規模競賽。他們不再追求單一模型的極致性能,而是聚焦“能力密度”與“性價比”,建構能讓普通人用起來的技術方案。以千問為例,通過建構從2B到2C、從基礎模型到專業領域的完整開源矩陣,它不再是一個孤立的模型,而是一整套可擴展、可定製化的解決方案。中國的開源生態呈現出更強的工程化特徵和商業化友好設計,也讓“能力密度”優勢轉化為全球生態影響力。例如,千問的開源協議允許商業使用而不收取授權費,初創企業能以極低成本獲得高品質的AI能力。這種“程式碼+工具鏈+生態”的系統性開放,讓中國開源模型在全球市場快速崛起。2025年初,矽谷一家風投機構調研顯示,超過60%的受訪初創企業表示,他們的產品開發基於或借鑑了中國開源模型。而到2025年年底,高盛與OpenRouter的聯合統計顯示,這一比例已攀升至80%。中國開源模型的全球下載量佔比達到17.1%,首次超越美國的15.8%,在非洲、中東、拉丁美洲等新興市場的採用率更是快速上升。“中國開源模型大幅降低AI開發成本”已成業界共識,部分初創企業能將相關成本降至原閉源方案的10%~20%。如今,#ChineseAI、#Qwen3Coder等話題在海外社交媒體熱度飆升,德國開發者感嘆其為“程式設計界的iPhone時刻”,全球開發者踴躍分享用中國開源模型5分鐘搭建網站、1小時開發AI搜尋工具的案例。據第三方統計,截至2025年年底,千問衍生模型數量破18萬,居全球第一。02 應用突圍:從“玩具”到“助理”的進化當開源模型成為全球技術共享的載體,AI應用賽道也迎來爆發。據AI Agents Directory 2025年4月統計,全球已上線AI Agent達1211個,2025年全年新增產品數量呈爆發式增長。但多數產品受制於基模能力、功能邊界或生態支撐,難以突破“娛樂玩具”的定位。去年底,有媒體統計稱,大多數通用型應用的使用者7日留存率普遍低於15%。“聊得爽、用不上”已成為行業普遍痛點,一款真正好用的AI Agent,究竟該具備那些特質?如何讓AI從螢幕裡的“文字顧問”,變成能落地辦事的“執行夥伴”?在吳嘉看來,數字世界裡,AI辦事的突破,離不開三個核心能力的提升:一是AI Coding,讓AI能精準呼叫各類服務介面;二是全模態理解,能讀懂使用者的文字、語音、圖片需求,甚至推理出隱性需求;三是超長上下文處理,輕鬆應對複雜任務。知名商業顧問劉潤在深度體驗千問“辦事”功能後,從使用者視角給出了他的“評測”答案。在他看來,過去絕大多數AI助手都停留在“推理層”,只能提供方案卻無法落地執行,本質上是“聰明的陪聊”;而千問“辦事”功能的核心突破,在於打通了“推理-執行”的閉環,成為“能幹的助理”。他先嘗試了一個簡單需求:“下午犯困,點個美式咖啡當下午茶。”千問立刻呼叫淘寶閃購的地址資訊,為他篩選出多款咖啡,清晰標註單價、距離、配送時間,還自動匹配了優惠紅包,全程無需跳出App,只需點選“選它”就能直達付款頁面,輕鬆完成下單。接著,他測試了更複雜的民生服務需求:“我要去上海工作了,幫我把社保從杭州轉過去。”千問隨即聯動支付寶服務,先明確辦理條件——杭州停保、上海參保、不滿50歲等,再推薦“支付寶”“隨申辦”線上快速辦理通道,不僅詳細說明辦理流程和注意事項,還直接提供辦事入口,一點就能直達操作頁面。更讓其驚豔的是千問App在複雜行程規劃上的表現。他計畫出差到長沙,並向千問發出指令:找一家不排隊的茶顏悅色,一家最火的中式點心店,一家本地人排隊的湘菜館,再定一間離三個地方都近的酒店。他原本以為千問會扔來一段乾巴巴的文字攻略,但等了兩三分鐘之後,千問展示了一份完整報告,其中包括高德地圖的路線、去程的機票,並可跳轉到飛豬購票窗口。接著是茶顏悅色的導航、酒店的預訂連結,以及返程的機票。來源:視訊截圖他感慨:“這那裡還是一個聊天工具,這就像是一個帶著工具箱的AI助理。”而這種真正“辦事幹活”的能力,正是AI從工具進化到助理的關鍵。他也借此對比了近日引發熱議的Manus和豆包手機,雖然它們都被視為“AI助理”,但二者與千問的差距,恰恰藏在權限的邊界裡。Manus基於大模型層的權限,本質還是個內建的AI大模型App,它可以提供資訊,但沒有打開App的權限。豆包手機使用的則是手機作業系統層的權限,本質是讓AI模擬人的手指來操作,但它也天然被攔在了許多超級App門外。第三種便是千問,它不需要模擬人的手指,直接可以調動高德規劃路線、調動飛豬搜尋機票,它使用的是App等級的權限,相當於拿著一張跨應用的最高通行證。千問App不光擁有“最高通行證”,還有一個“最強大腦”。他又特意給千問出了一道更高階的題:“幫我復盤過去雙11玩法和行銷策略。”指令發出後,千問就展示了它的“多模態理解力”,梳理了雙11的規則、玩法、行銷節奏等複雜;接著又展示了它的“結構化交付能力”。最終,它呈現的是一份邏輯嚴密、詳細具體的分析報告,同時還附上整理好的表格文件——整個任務只用了不到1分鐘。來源:千問操作介面截圖由此可以看出,相比於Manus更擅長在模型層、公域資訊層做閉環任務,千問可以做到其他AI助手難以完成的調動App、支付下單等動作。據瞭解,千問App自2025年11月上線以來,公測23天月活使用者即突破3000萬,30天月活破4000萬,2025年12月以149.03%的月活增速登頂全球AI應用增速榜。截至2026年1月15日,千問C端月活使用者已正式突破1億,在學生和白領群體中形成“現象級”傳播。吳嘉透露,今年春節後,千問App將開放第三方接入。03 產業基因:生於本土,長於實踐吳嘉在1月15日召開的千問App發佈會上強調:千問的獨特優勢在於“最強模型與最豐富生態的結合”。來源:受訪者一個“集大成者”的千問,又是如何生長起來的?其根植於中國特有的產業土壤、多元場景、工程化積累,以及中國AI創業者的務實導向。首先,中國擁有全球最為多元的消費場景和商業生態,一個能在中國市場良好運行的AI模型,需要具備處理複雜場景和邊緣案例的強大能力,中國的AI技術也由此鍛鍊出了更強的實用性與適配能力。據瞭解,千問的訓練資料覆蓋了阿里生態內超10億使用者的真實互動場景,包括購物、出行、支付、辦公等200多個細分領域,僅本地生活場景就包含超1000萬商家的服務資料。這種海量且多元的資料積累,讓千問能精準理解“加辣少鹽”“就近停車”“周末親子游小眾目的地”等具象化、個性化需求。其次,中國科技企業擁有在大規模使用者、複雜系統中生長出的強大工程化能力。以千問的AI購物功能為例,其背後是一套完整的交易保障系統,包括異常檢測、風險控制和使用者體驗最佳化等多個模組。這些都源自中國電商平台在長期營運和極端場景下積累的豐富經驗。不同於矽谷常見的“技術尋找問題”模式,中國AI企業更多採用“問題驅動技術”路徑。北京大學電腦科學技術系教授、北京智源人工智慧研究院理事長黃鐵軍在2025年中關村論壇期間接受採訪時指出,中國AI發展始終以解決實際問題為導向。這種思考方式,使中國科技產品更注重易用性和實用性。而阿里在B端積累的技術能力和生態價值也將在C端得到釋放。千問不僅整合了淘寶、支付寶、飛豬等C端生態資源,更將阿里雲在工業網際網路、金融科技、智慧政務等領域的B端能力下沉,形成“B端能力支撐C端體驗,C端場景反哺B端最佳化”的正向循環。“我們的目標是,大部分生活辦事場景,只用千問App就夠了。”吳嘉在前述發佈會上稱,“現階段,我們沒有商業化考量,推薦商品會基於價格最優、送達最快等綜合因素,優先關注使用者滿意度和產品能力。”吳嘉還表示,“我們不追逐短期流量規模。在智力時代,AI產品的關鍵是過沒過智能門檻,能不能像人一樣服務、執行,有沒有高精準率和滿意度。我們會一步步邁進,把千問App打造成最強大的人類AI助手,真正讓AI幫助到每一個人。”04 未來:開放、共生與差異化立足長遠來看,阿里和千問的創新意義更在於:伴隨中國AI的崛起,技術從矽谷流向中國的單向模式正被打破。這種逆轉不僅體現在開源模型的全球擴散,更延伸至技術策略、思維方式與投資邏輯的全面重構。資料正在印證這一趨勢:Hugging Face 2025年度報告等第三方機構資料顯示,千問、DeepSeek等中國模型的開發者社區活躍度呈現爆發式增長,年增速預估超300%,貢獻者覆蓋全球120多個國家與地區,其中矽谷開發者貢獻佔比達27%,意味著中國技術正成為全球創新的“基礎設施”。這種反向借鑑不僅體現在技術策略上,也深刻影響了矽谷的思維方式。過去矽谷企業更傾向於“技術驅動創新”,先突破前沿參數再尋找應用場景;而如今,越來越多企業開始關注如何將AI技術與具體場景深度結合,而非僅僅追求技術參數的領先。矽谷知名科技分析師本·湯普森在其多篇專欄中指出,AI需回歸商業實用價值。這種思維轉變最直接的體現,是矽谷科技巨頭的業務調整:Google將AI團隊與搜尋、雲服務場景深度整合,2025年推出的“AI+企業協作”方案,被外界視為直接借鑑中國AI“生態聯動”的落地模式。全球AI產業發展更加多元和開放的今天,中國和矽谷的AI發展路徑已呈現出既競爭又互補的格局。中國AI的“勝負手”在於應用落地和生態建構,這種差異化,為全球AI創新提供了更多可能。未來,兩地的AI發展和互動或將更加緊密。AI的全球故事正翻開新的一頁。這一頁上,矽谷與中國互為鏡鑑,也將共赴未來。 (中國企業家雜誌)
DeepMind CEO:中國AI落後西方約六個月,DeepSeek R1 反應過度/DeepSeek 新模型 MODEL1 程式碼曝光
DeepMind CEO:中國 AI 公司落後西方約六個月,DeepSeek R1 反應過度/X 開源核心推薦演算法:基於 Grok 的 Transformer 模型驅動資訊流/DeepSeek 新模型 MODEL1 程式碼曝光,預示新架構最快 2 月發佈X 開源核心推薦演算法:基於 Grok 的 Transformer 模型驅動資訊流要點一:演算法技術架構與工作原理X(原 Twitter)於 2026 年 1 月 20 日在 GitHub 上開源了其核心推薦系統程式碼,該系統完全依賴於 xAI 的 Grok Transformer 模型來學習使用者參與序列的相關性。系統通過分析使用者的互動歷史(點選、點贊等行為),結合網路內帖子和利用機器學習分析"網路外"內容,為使用者生成個性化資訊流。演算法會過濾被遮蔽帳戶、靜音關鍵詞以及暴力或垃圾內容,然後根據相關性、內容多樣性以及使用者可能的互動行為(點贊、回覆、轉發等)對內容進行排序。系統採用 RecsysBatch 輸入模型,使用統一的 AI 驅動 Transformer 架構,完全實現自動化推薦,無需人工特徵工程。TechCrunch要點二:開源背景與爭議此次開源履行了馬斯克一周前的承諾,承諾每四周提供演算法透明度更新。然而,X 當前正面臨多重監管壓力:歐盟監管機構因其驗證系統違反《數字服務法》透明度義務對其處以 1.4 億美元罰款;加州總檢察長辦公室和國會議員正在審查 Grok 被用於製作女性和未成年人的性化內容問題。批評人士認為這是"透明度作秀",因為 2023 年首次開源時被批評"不完整",未能揭示組織內部運作或程式碼工作原理。值得注意的是,自馬斯克 2022 年收購以來,X 從上市公司轉為私有公司,透明度報告從每年多次減少至 2024 年 9 月才發佈首份報告。TechCrunchNetflix Q4 業績強勁:付費使用者突破 3 億,2025 年收入預期上調要點一:Q4 財務資料與使用者增長Netflix 於 2025 年 1 月 21 日公佈的 2024 年第四季度財報顯示,營收同比增長 16% 至 102.5 億美元,超過市場預期的 101.1 億美元;每股收益 4.27 美元,超過預期的 4.20 美元。公司在該季度新增 1900 萬付費會員,創下季度最大增長記錄,使全球付費會員總數達到 3.0163 億(301.63 million),超過預期的 2.909 億。淨利潤達 18.7 億美元,而上年同期為 9.38 億美元。包括"額外會員帳戶"在內,Netflix 全球觀眾估計超過 7 億。Q4 的成功得益於《魷魚遊戲》第二季、Jake Paul 對 Mike Tyson 拳擊賽以及聖誕節 NFL 比賽等內容的推動。聯席 CEO Ted Sarandos 表示,為體育賽事而來的使用者留存率與其他熱門內容使用者相當。CNBC要點二:2025 年展望與業務戰略Netflix 將 2025 全年收入預期從此前預測上調約 5 億美元,調整至 435-445 億美元區間,同時宣佈部分套餐價格上漲 1-2 美元/月。公司表示將增加內容投入,2026 年內容支出計畫增長 10%。廣告支援套餐表現強勁,在提供該選項的國家中佔註冊量的 55% 以上,會員數環比增長約 30%。Netflix 表示有望在 2025 年在所有廣告業務國家達到充足規模,大幅增長廣告業務是 2025 年首要任務。這是 Netflix 最後一次按季度報告付費訂戶數,未來將在第二和第四季度發佈"參與度報告"。2025 年將推出《怪奇物語》和《星期三》回歸,以及《利刃出鞘 3》、Adam Sandler 的《快樂吉爾莫 2》等重磅內容。公司強調其優勢在於專注核心業務,沒有管理衰退的線性網路等分心因素。CNBC馬斯克起訴 OpenAI 案內部檔案曝光:微軟與 OpenAI 十年合作關係細節披露要點一:微軟-OpenAI 關係演變與關鍵轉折點最新法庭檔案揭示了微軟與 OpenAI 長達十年的合作關係內幕。2015 年 12 月 OpenAI 成立時,微軟 CEO 納德拉發現 AWS 已成為捐助方而驚訝詢問團隊。2016 年,在馬斯克支援下(稱貝索斯"有點工具人"),微軟以 5000 萬美元計算資源贏得合作。2019 年,微軟投資 10 億美元,獲得 OpenAI 商業許可和獨家雲端運算權,以及對"重大決策"的批准權(包括結構變更、合併等),當時微軟出資佔總投資 85%,實際擁有否決權。微軟 CFO Amy Hood 評論 OpenAI 的利潤上限"實際上比 90% 的上市公司都大,並不太受約束"。2022 年 11 月 ChatGPT 發佈時董事會從社交媒體上得知,微軟隨後在 2023 年 1 月追加 100 億美元投資。2023 年 11 月 Altman 被解僱危機中,微軟在 24 小時內成立 Microsoft RAI Inc. 子公司準備接收 OpenAI 團隊,估算成本 250 億美元,並在新董事會遴選中發揮關鍵作用。GeekWire要點二:最新訴訟進展與公司治理轉變馬斯克於 2026 年 1 月尋求從 OpenAI 和微軟獲得 790-1340 億美元賠償,指控 OpenAI 背離非營利使命欺騙了他。聯邦法官已裁定此案將於今春進行陪審團審判,OpenAI 和微軟未能逃避審判。OpenAI 反駁稱馬斯克在 2017 年就同意需要營利性結構,談判破裂是因為 OpenAI 拒絕給他完全控制權。2024 年 12 月 27 日,OpenAI 宣佈解除限制利潤結構,內部稱為"Project Watershed"。2025 年 9 月簽署諒解備忘錄,45 天內完成條款。微軟的"重大決策"批准權涵蓋此次重組,雖無董事會席位和投票權,但重組無法在未經微軟批准下進行。Morgan Stanley 估值 1220-1770 億美元,Goldman Sachs 估值 3530 億美元,最終以 5000 億美元估值完成(軟銀領投),微軟股權從 32.5% 稀釋至 27%,但 OpenAI 承諾未來在 Azure 上支出 2500 億美元。同時微軟失去新雲工作負載優先權,但 IP 權利延長至 2032 年。2025 年 11 月,OpenAI 與 AWS 簽訂 7 年 380 億美元基礎設施協議,實現雲服務商多元化。GeekWireDeepMind CEO:中國 AI 公司落後西方約六個月,DeepSeek R1 反應過度要點一:對中國 AI 能力的評估Google DeepMind CEO Demis Hassabis 於 2026 年 1 月 20 日在達沃斯世界經濟論壇接受 Bloomberg 採訪時表示,中國 AI 公司目前落後領先西方實驗室約六個月。他認為市場對 2025 年發佈的 DeepSeek R1 模型的反應是"大規模過度反應"(massive overreaction)。Hassabis 表示中國公司"非常擅長追趕前沿水平,並且越來越有能力做到這一點",但並未實現科學突破。他此前在 2025 年 2 月曾評價 DeepSeek 的 AI 模型"可能是中國最好的工作",但補充說這不是科學進步,炒作被"誇大了"。這一評估與業界對中國 AI 快速發展的擔憂形成對比,Hassabis 試圖平息內部員工對 DeepSeek 的焦慮情緒。Bloomberg要點二:技術競爭態勢分析Hassabis 的評估反映了西方 AI 領導者對中國追趕速度的謹慎樂觀。雖然承認中國在快速進步,但強調其主要優勢在於"追趕"而非創新性突破。DeepSeek 作為中國 AI 初創公司,以遠低於美國競爭對手的成本開發出具有競爭力的 AI 模型,引發了對美國高額 AI 投資必要性的質疑。然而 Hassabis 的言論暗示,儘管 DeepSeek 展現了成本效率,但在技術前沿性和創新能力上,西方實驗室仍保持領先。這一觀點與當時市場因 DeepSeek 發佈而出現的恐慌情緒形成鮮明對比,試圖重新定位競爭格局的真實狀態。值得注意的是,Hassabis 的評估也可能帶有戰略性考量,旨在穩定投資者信心並維持西方在 AI 領域的主導敘事。BloombergAnthropic CEO:向中國出售 AI 晶片如同"向朝鮮出售核武器"要點一:國家安全警告與政策批評Anthropic CEO Dario Amodei 於 2026 年 1 月 20 日在達沃斯世界經濟論壇接受 Bloomberg 採訪時,強烈批評川普政府允許向中國出售先進 AI 晶片的決定,將其比作"向朝鮮出售核武器"。Amodei 表示美國在晶片製造能力上領先中國"許多年",向中國出口這些晶片可能幫助北京縮小差距,具有"令人難以置信的國家安全影響"。他描繪了 AI 的未來場景:"一個資料中心裡的天才之國",想像"1 億個比任何諾貝爾獎得主都聰明的人,它將受某一個國家的控制"。Amodei 表示中國在 AI 發展上仍然落後,並受到晶片禁運的制約。美國工業和安全域(BIS)上周修訂了向中國出售晶片的許可政策,川普隨後宣佈對 Nvidia 計畫運往中國的晶片(如 H200)徵收 25% 的關稅。Axios要點二:行業內部分歧與政治博弈Amodei 在業界對政府政策的批評中較為突出,儘管試圖緩和緊張關係,但並非孤立聲音。在國會山,眾議院外交事務委員會主席 Brian Mast 等共和黨高層正在推動立法,阻止中國獲取敏感美國技術。MAGA 影響者 Laura Loomer 和 AI 與加密貨幣主管 David Sacks 則為總統政策辯護。Amodei 在採訪中避免直接批評 Sacks(被廣泛視為川普 AI 政策背後的策劃者),僅表示"這一特定政策並不明智"。目前某些先進 AI 晶片(如 Nvidia H200、AMD MI325X)向中國出口的各項準備工作正在落實。這一爭議凸顯了商業利益、國家安全考量與政治立場之間的複雜博弈,以及 AI 行業領導者在公共政策制定中日益重要的發聲角色。Amodei 此前撰文強調需要加強對華晶片出口管制,此次公開批評進一步表明他在這一議題上的堅定立場。Axios百度文心助手月活使用者突破 2 億,與京東美團等平台深度整合要點一:使用者規模與生態整合百度旗下 AI 助手"文心一言"(Ernie Assistant)月活躍使用者數已突破 2 億大關,這一里程碑標誌著中國科技巨頭在 AI 助手領域競爭的顯著進展。根據《華爾街日報》2026 年 1 月 20 日報導,文心一言已與京東(JD.com)、美團(Meituan)和攜程(Trip.com)等廣泛使用的應用程式實現連結整合,使得該 AI 助手能夠幫助使用者預訂機票、訂購外賣等實際服務。這種深度生態整合使文心一言不再僅是獨立的聊天機器人,而是嵌入到使用者日常生活場景的智能助手。百度股價因這一消息上漲,反映了市場對其 AI 業務增長的積極預期。除活躍使用者基數外,文心一言每日 API 請求量也達到 2 億次,顯示其在企業客戶中的廣泛應用。百度還擁有超過 85,000 家企業客戶使用其 AI 服務。Wall Street Journal要點二:中國 AI 競爭格局隨著中國科技巨頭在 AI 領域競爭的加劇,百度、阿里巴巴、騰訊等公司都在爭奪 AI 助手市場份額。百度的文心一言現已整合到其旗艦搜尋引擎中,並在 PC 端可用,重塑了使用者搜尋和互動方式,從傳統關鍵詞搜尋轉向 AI 驅動的對話式搜尋。這一轉變體現了百度將自身從傳統搜尋引擎轉型為 AI 平台的戰略。與競爭對手相比,百度在中文語言模型和本土化服務整合方面具有優勢。文心一言與京東、美團等電商和生活服務平台的整合,使其能夠直接參與交易環節,而不僅僅提供資訊查詢。這種"AI+服務"的模式代表了中國 AI 應用的獨特路徑,與美國市場以通用對話為主的 ChatGPT 等產品形成差異。2 億月活使用者的規模雖然顯著,但在中國龐大的網際網路使用者基數中仍有巨大增長空間,預示著 AI 助手市場的激烈競爭將持續升級。Wall Street Journal字節跳動擴張雲業務:AI 雲市場份額近 13%,挑戰阿里巴巴主導地位要點一:市場份額與擴張戰略根據《金融時報》2026 年 1 月 20 日報導及 IDC 資料,字節跳動旗下火山引擎(Volcano Engine)在 2025 年上半年佔據中國 AI 雲服務市場近 13% 的份額,營收約 3.9 億美元,而阿里巴巴保持約 23% 的市場領先地位。字節跳動正在通過招聘銷售人員和降低價格策略積極擴張其雲業務,成為增長最快的挑戰者。公司依託其短影片平台抖音(TikTok)和今日頭條積累的海量資料和 AI 技術優勢,向企業客戶提供 AI 驅動的雲服務。字節跳動宣稱每日處理 30 兆 tokens,佔據 49.2% 的 token 消費份額,而阿里巴巴則以 334 億元人民幣的雲收入和更成熟的企業客戶基礎作為反擊。儘管雙方在 2025 年上半年的市場份額都略有下滑,但字節跳動的快速崛起仍對阿里巴巴長期主導的雲端運算市場構成威脅。Financial Times要點二:雲端運算市場競爭格局演變中國 AI 雲基礎設施競爭已進入白熱化階段,字節跳動和阿里巴巴成為最激進的競爭者。分析師指出,字節跳動在 AI 雲市場的挑戰對阿里巴巴構成顯著壓力,特別是在 AI 原生應用和新興企業客戶群體中。阿里巴巴雖然保持整體市場領先(約 35.8% 的 AI 雲市場份額,超過其後三家競爭對手的總和),但面臨增長放緩壓力。字節跳動的優勢在於其在消費網際網路領域積累的 AI 技術和演算法能力,以及願意提供更有競爭力的價格。市場研究機構預測,中國雲端運算市場規模將從 2025 年的 504.7 億美元增長至 2031 年的更大規模。這場競爭的背後是對未來 AI 經濟基礎設施控制權的爭奪:兩家公司都聲稱在中國 AI 領域處於領先地位,但採取不同的戰略路徑——阿里巴巴強調企業雲收入和成熟的商業模式,而字節跳動則突出技術處理能力和消費者應用經驗。此次雲業務擴張也被視為字節跳動多元化戰略的一部分,在面臨 TikTok 在海外監管壓力的背景下,拓展 B2B 企業服務市場。Financial TimesOpenAI 將於 2026 年下半年推出首款硬體裝置,無螢幕可穿戴形態要點一:產品時間表與形態特徵OpenAI 全球事務主管 Chris Lehane 於 2026 年 1 月 19 日在達沃斯 Axios House 活動中透露,公司"正按計畫"在 2026 年下半年推出首款硬體裝置。這一時間表與去年 5 月 CEO Sam Altman 收購前蘋果設計總監 Jony Ive 公司時的暗示一致,Ive 公司當時發佈的宣傳視訊中寫道"期待明年與您分享我們的作品"。根據多方報導,OpenAI 正在開發小型無螢幕裝置原型,可能是可穿戴形式,將通過互動方式與使用者溝通。Altman 此前表示該裝置將比智慧型手機更"平和",使用者會對其簡潔性感到震驚。Lehane 將"裝置"列為 OpenAI 2026 年的重要看點之一,但拒絕透露具體細節,包括是別針、耳機還是其他形態。他表示將在"今年晚些時候"分享消息,強調這是"最可能"的時間表,但"我們會看看事情如何進展"。Lehane 並未承諾裝置今年一定上市銷售,暗示發佈可能僅是產品展示而非正式商業化。Axios要點二:AI 硬體市場前景與競爭態勢儘管早期 AI 裝置如 Humane 的 AI Pin 基本失敗,但 2026 年預計將迎來眾多 AI 硬體新嘗試。高通 CEO Cristiano Amon 在同一活動中透露,目前每年約有 1000 萬台 AI 智能眼鏡出貨,預計今年或明年將增至 1 億台。他表示 AI 裝置將採取多種形式,包括帶攝影機的耳塞和珠寶,高通晶片將為大多數產品提供動力,但 AI 智能眼鏡可能是銷量最大的品類。關於 OpenAI 裝置是否使用高通晶片,Amon 較為謹慎地表示"我會說我們一直在與他們合作,所以我們對正在做的事情感到興奮,但他們會談論自己的裝置"。這暗示雙方可能存在某種合作關係。OpenAI 進軍硬體市場代表著從純軟體/API 提供商向垂直整合的戰略轉變,類似於蘋果的軟硬體一體化模式。與 Jony Ive 的合作更強化了這一願景,利用 Ive 在蘋果創造 iPhone、iPad 等革命性產品的經驗。然而,AI 硬體市場尚未找到真正的產品市場契合點,OpenAI 面臨的挑戰是如何創造出既有實用價值又能提供超越智慧型手機的獨特體驗的裝置。Axios字節跳動 AI 平台 Coze 發佈 2.0 版本,支援長期自主規劃與智能辦公要點一:核心功能升級與技術突破字節跳動旗下 AI Agent 開發平台 Coze(中文名"扣子")於 2026 年 1 月 19 日發佈 2.0 版本,實現從"AI 輔助工具"到"主動執行的 AI 工作夥伴"的重大升級。新版本具備三大核心能力:Agent Skills(技能封裝)、Agent Plan(長期規劃)和 Agent Office(智能辦公)。Agent Skills 功能允許將複雜工作流封裝為可呼叫的技能包,通過簡單的自然語言指令即可執行多步驟任務,例如一句話完成從資料收集到可視化的全流程。Agent Plan 實現了從"單次對話"到"長期服務"的跨越,使用者只需設定宏觀目標(如管理社交媒體帳戶),AI Agent 就能自主分解步驟、執行任務並持續最佳化,支援複雜目標的閉環管理和長期任務的自主執行。Agent Office 增強了深度上下文理解能力,可輔助生成報告、製作 PPT、梳理會議紀要等職場辦公場景,與 WPS、飛書等辦公軟體深度整合。扣子程式設計功能支援雲端協作開發,使用者可使用 Python、JavaScript 等語言編寫自訂邏輯。Readhub要點二:應用場景與市場定位扣子 2.0 主要應用於行銷文案、長期計畫管理、職場辦公等場景。歷經 700 多天迭代,扣子已積累上千萬使用者。此次升級通過"技能封裝"和"長期計畫"等功能,試圖解決 AI 在複雜工作流中執行力不足的問題。與初版相比,2.0 版本不再侷限於單純的對話互動,而是強調 AI Agent 的自主規劃和持續執行能力。例如在行銷場景中,Agent 可以持續監測市場趨勢、自動生成內容、最佳化投放策略;在項目管理中,可以跟蹤進度、協調資源、提醒風險。扣子 2.0 的發佈體現了字節跳動在企業級 AI 應用領域的戰略佈局,與其消費級 AI 產品(如豆包)形成互補。作為低程式碼甚至零程式碼的 AI Bot 開發平台,扣子降低了企業和開發者建構定製化 AI 智能體的門檻。這一戰略與微軟的 Copilot Studio、OpenAI 的 GPTs 等產品形成競爭,但扣子更強調"長期規劃"和"自主執行"能力,試圖在 AI Agent 市場中建立差異化優勢。平台支援可視化工作流、自主編排、自動規劃等多種智能體建構方式,並可分發到多個管道。ReadhubDeepSeek 新模型 MODEL1 程式碼曝光,預示新架構最快 2 月發佈要點一:MODEL1 程式碼細節與技術特徵DeepSeek 在 GitHub 上更新的 FlashMLA 程式碼庫中,橫跨 114 個檔案有 28 處提到了神秘的"MODEL1"識別碼,這被認為是下一代旗艦模型的開發代號。程式碼分析顯示,MODEL1 與現有的 V32(DeepSeek-V3.2)架構並列出現,暗示這是一個全新的模型架構。具體技術差異體現在 KV 快取佈局、稀疏性處理和 FP8 解碼等方面,顯示該模型在記憶體最佳化上進行了多處改進。MODEL1 可能整合了最佳化的殘差連接、Engram 記憶模組與 mHC 流形約束技術等創新。開發者推斷 MODEL1 很可能是 DeepSeek-V4 的內部開發代號或首個工程版本。此前《The Information》月初爆料稱,DeepSeek 將在 2026 年 2 月中旬農曆新年期間推出新一代旗艦 AI 模型 DeepSeek V4,將具備更強的寫程式碼能力。MODEL1 在開放原始碼中的意外現身,類似於 DeepSeek 發佈前的慣例,增加了 2 月發佈的可能性。IT之家要點二:發佈時機與市場影響DeepSeek-R1 發佈剛滿一周年之際,MODEL1 的曝光引發行業高度關注。如果按照預期在 2026 年 2 月發佈,DeepSeek V4 將成為中國 AI 公司在農曆新年期間推出的重磅產品。DeepSeek 以低成本高效能著稱,其 R1 模型曾在 2025 年引發全球關注(儘管 DeepMind CEO 認為反應"過度")。新模型如果在程式碼能力上實現顯著提升,將進一步鞏固 DeepSeek 在開源 AI 領域的地位,並加劇與 OpenAI、Anthropic 等西方公司的競爭。MODEL1 程式碼中對記憶體最佳化、稀疏性處理等方面的改進,暗示 DeepSeek 繼續追求"用更少資源實現更強性能"的技術路線,這對受美國晶片出口限制的中國 AI 公司尤為重要。不少行業分析人士認為,MODEL1 在開放原始碼中的提前曝光可能是 DeepSeek 的一種預熱策略,類似其以往的發佈模式。如果 DeepSeek V4 如期在 2 月發佈並展現顯著進步,將對全球 AI 市場格局產生重要影響,特別是在程式碼生成和開發者工具領域。這也將考驗 Demis Hassabis"中國落後六個月"論斷的精準性。IT之家香港 IPO 市場強勁開局:新能源、AI、電動車和生物科技驅動增長要點一:2026 年開局表現與融資資料根據香港交易所(HKEX)CEO 陳穎婷(Bonnie Chan)在 2026 年 1 月達沃斯世界經濟論壇前夕發表的文章,2026 年前三周已有 11 家公司在香港上市,融資近 40 億美元。目前有 50 份新上市申請提交,超過 300 家公司正在排隊等待上市批准。這延續了 2025 年的強勁勢頭:2025 年共有 114 家公司在主機板上市,融資 372.2 億美元,同比增長 230%,推動香港重回自 2019 年以來全球最大 IPO 市場的位置。寧德時代的 53 億美元 IPO 是 2025 年香港最大的上市項目。陳穎婷表示,新能源、人工智慧、電動汽車和生物技術公司將繼續成為未來幾年香港 IPO 市場的驅動力。她寫道:"過去一年,數十家綠色能源、自動化和其他領域的新公司在香港上市,使它們能夠擴大研究規模和全球影響力。"South China Morning Post要點二:市場前景與戰略定位陳穎婷強調 HKEX 的角色是"幫助更快地翻開這個故事的篇章,使更清潔的能源、變革性的醫療保健和更高的生活水平從承諾走向實踐"。她表示,從上市申請管道來看,她的樂觀情緒得到了"穩定流動的變革性創意"的支援,"下一章進步正由這些富有遠見的公司、他們大膽的創意以及賦能它們的市場書寫"。香港 IPO 市場的復甦得益於多重因素:中國經濟復甦預期、科技和新能源行業的強勁增長、以及香港作為連接中國內地與國際資本市場橋樑的獨特地位。特別是在 AI、電動車和生物科技等高增長領域,許多中國公司選擇香港作為上市地,以獲得國際投資者的認可和資金支援。陳穎婷的表態反映了 HKEX 對 2026 年市場的信心,預計科技創新類企業將繼續主導香港資本市場。這一趨勢與中國政府推動"新質生產力"、支援科技創新和綠色轉型的政策方向高度一致,香港正在鞏固其作為亞洲科技企業首選上市地的地位。South China Morning Post (AI Daily Insights)
DeepSeek R1 發佈一周年,不卷功能、不融資、不著急,硬控了科技世界
「伺服器繁忙,請稍後再試。」一年前,我也是被這句話硬控的使用者之一。DeepSeek 帶著 R1 在一年前的昨天(2025.1.20)橫空出世,一出場就吸引了全球的目光。那時候為了能順暢用上 DeepSeek,我翻遍了自部署教學,也下載過不少號稱「XX - DeepSeek 滿血版」的各類應用。一年後,說實話,我打開 DeepSeek 的頻率少了很多。豆包能搜尋、能生圖,千問接入了淘寶和高德,元寶有即時語音對話和微信公眾號的內容生態;更不用說海外的 ChatGPT、Gemini 等 SOTA 模型產品。當這些全能 AI 助手把功能列表越拉越長時,我也很現實地問自己:「有更方便的,為什麼還要守著 DeepSeek?」於是,DeepSeek 在我的手機裡從第一屏掉到了第二屏,從每天必開變成了偶爾想起。看一眼 App Store 的排行榜,這種「變心」又似乎不是我一個人的錯覺。免費應用下載榜的前三名,已經被國產網際網路大廠的「御三家」包攬,而曾經霸榜的 DeepSeek,已經悄悄來到了第七名。在一眾恨不得把全能、多模態、AI 搜尋寫在臉上的競品裡,DeepSeek 顯得格格不入,51.7 MB 的極簡安裝包,不追熱點,不卷宣發,甚至連視覺推理和多模態功能都還沒上。但這正是最有意思的地方。表面上看,它似乎真的「掉隊」了,但實際是 DeepSeek 相關的模型呼叫仍是多數平台的首選。而當我試圖總結 DeepSeek 過去這一年的動作,把視線從這個單一的下載榜單移開,去看全球的 AI 發展,瞭解為什麼它如此地不慌不忙,以及即將發佈的 V4,又準備給這個行業帶來什麼新的震動;我發現這個「第七名」對 DeepSeek 來說毫無含金量,它一直是那個讓巨頭們真正睡不著覺的「幽靈」。掉隊?DeepSeek 有自己的節奏當全球的 AI 巨頭都在被資本裹挾著,通過商業化來換取利潤時,DeepSeek 活得像是一個唯一的自由球員。看看它的競爭對手們,無論是國內剛剛港股上市的智譜和 MiniMax,還是國外瘋狂捲投資的 OpenAI 和 Anthropic。為了維持昂貴的算力競賽,就連馬斯克都無法拒絕資本的誘惑,前幾天剛剛才為 xAI 融了 200 億美元。但 DeepSeek 至今保持著「零外部融資」的紀錄。年度私募百強榜,按照公司平均收益排名,幻方量化位於第七名,百億以上規模排名第二|圖片來源:https://www.simuwang.com/news/285109.html在這個所有人都急著變現、急著向投資人交作業的時代,DeepSeek 之所以敢掉隊,是因為它背後站著一台超級「印鈔機」,幻方量化。作為 DeepSeek 的母公司,這家量化基金在去年實現了超高的 53% 回報率,利潤超過 7 億美元(約合人民幣 50 億元)。梁文鋒直接用這筆老錢,來供養「DeepSeek AGI」的新夢。這種模式,也讓 DeepSeek 極其奢侈地擁有了對金錢的掌控權。沒有資方的指手畫腳。沒有大公司病,許多拿了巨額融資的實驗室,陷入了紙面富貴的虛榮和內耗,就像最近頻頻爆出有員工離職的 Thinking Machine Lab;還有小扎的 Meta AI 實驗室各種緋聞。只對技術負責, 因為沒有外部估值壓力,DeepSeek 不需要為了財報好看而急於推出全能 App,也不需要為了迎合市場熱點去捲多模態。它只需要對技術負責,而不是對財務報表負責。App Store 的下載量排名,對於一家需要向 VC 證明「日活增長」的創業公司來說是命門。但對於一家只對 AI 發展負責、不僅不缺錢還不想被錢通過 KPI 控制的實驗室來說,這些有關市場的排名掉隊,或許正是它得以保持專注、免受外界噪音干擾的最佳保護色。更何況,根據 QuestMobile 的報告,DeepSeek 的影響力完全沒有「掉隊」改變生活,也影響了世界 AI 軍備競賽即便 DeepSeek 可能根本不在意,我們是否已經選擇了其他更好用的 AI 應用,但它過去這一年帶來的影響,可以說各行各業都沒有錯過。矽谷的「DeepSeek 震撼」最開始的 DeepSeek,不僅僅是一個好用的工具,更像是一個風向標,用一種極其高效且低成本的方式,打碎了矽谷巨頭們精心編織的高門檻神話。圖片來源:https://openaiglobalaffairs.substack.com/p/deepseek-at-1如果說一年前的 AI 競賽是比誰的顯示卡多、誰的模型參數大,那麼 DeepSeek 的出現,硬生生把這場競賽的規則改寫了。在 OpenAI 及其內部團隊(The Prompt) 的最近發佈總結回顧中,他們不得不承認,DeepSeek R1 的發佈在當時給 AI 競賽帶來了「極大的震動(jolted)」,甚至被形容為一場「地震級的衝擊(seismic shock)」。DeepSeek 一直在用實際行動證明,頂尖的模型能力,不需要天價的算力堆砌。根據 ICIS 情報服務公司最近的分析,DeepSeek 的崛起徹底打破了算力決定論。它向世界展示了,即使在晶片受到限制、成本極其有限的情況下,依然可以訓練出性能比肩美國頂尖系統的模型。AI 競賽正在演變成一場漫長的馬拉松|圖片來源:https://www.icis.com/asian-chemical-connections/2026/01/a-year-on-from-deepseek-us-versus-china-in-the-ai-race/這直接導致了全球 AI 競賽從「造出最聰明的模型」,轉向了「誰能把模型做得更高效、更便宜、更易於部署」。微軟報告裡的「另類」增長當矽谷巨頭們還在爭奪付費訂閱使用者時,DeepSeek 也開始在被巨頭遺忘的地方紮根。在微軟上周發佈的《2025 全球 AI 普及報告》中,DeepSeek 的崛起被列為 2025 年「最意想不到的發展之一」。報告揭示了一個有意思的資料:非洲使用率高:因為 DeepSeek 的免費策略和開源屬性,消除了昂貴的訂閱費和信用卡門檻。它在非洲的使用率是其他地區的 2 到 4 倍。佔領受限市場: 在那些美國科技巨頭難以觸達或服務受限的地區,DeepSeek 幾乎成了唯一的選擇。資料顯示,它國內的市場份額高達 89%,在白俄羅斯達到 56%,在古巴也有 49%。微軟在報告裡也不得不承認,DeepSeek 的成功更加確定了,AI 的普及不僅取決於模型有多強,更取決於誰能用得起。全球南方地區 AI 普及的程度還有很大的提升空間|https://www.microsoft.com/en-us/corporate-responsibility/topics/ai-economy-institute/reports/global-ai-adoption-2025/下一個十億級 AI 使用者,可能不會來自傳統的科技中心,而是來自 DeepSeek 覆蓋的這些地區。歐洲:我們也要做 DeepSeek不僅是矽谷,DeepSeek 的影響跨越了整個地球,歐洲也不例外。歐洲一直是被動地使用美國的 AI,雖然也有自己的模型 Mistral,但一直不溫不火。DeepSeek 的成功讓歐洲人看到了一條新路,既然一家資源有限的中國實驗室能做到,歐洲為什麼不行?據連線雜誌最近的一篇報導,歐洲科技界正在掀起一場「打造歐洲版 DeepSeek」的競賽。不少來自歐洲的開發者,開始打造開源大模型,其中一個叫 SOOFI 的歐洲開放原始碼專案更是明確表示,「我們將成為歐洲的 DeepSeek。」DeepSeek 過去這一年的影響,也加劇了歐洲對於「AI 主權」的焦慮。他們開始意識到,過度依賴美國的閉源模型是一種風險,而 DeepSeek 這種高效、開放原始碼的模式,正是他們需要的參照。關於 V4,有這些資訊值得關注影響還在繼續,如果說一年前的 R1 是 DeepSeek 給 AI 行業的一次示範,那麼即將到來的 V4,會不會又是一次反常識的操作。根據前段時間零零散散的爆料,和最近公開的技術論文,我們梳理了關於 V4 最值得關注的幾個個核心訊號。1. 新模型 MODEL1 曝光在 DeepSeek-R1 發佈一周年之際,官方 GitHub 程式碼庫意外曝光了代號為「MODEL1」的全新模型線索。在程式碼邏輯結構中,「MODEL1」是作為與「V32」(即 DeepSeek-V3.2)並列的獨立分支出現的,這一細節意味著「MODEL1」並不共享 V3 系列的參數配置或基礎架構,而是一個全新的、獨立的技術路徑。結合之前的爆料和洩露的程式碼片段,我們梳理了「MODEL1」可能存在的技術特徵:程式碼顯示其採用了與現行模型完全不同的 KV Cache 佈局策略,並在稀疏性(Sparsity)處理上引入了新機制。在 FP8 解碼路徑上有多處針對性的記憶體最佳化調整,預示著新模型在推理效率和視訊記憶體佔用上可能有更好的表現。此前爆料稱,V4 的程式碼表現已超越 Claude 和 GPT 系列,並且具備處理複雜項目架構和大規模程式碼庫的工程化能力。業界普遍推測,DeepSeek 近期發表的兩篇重磅論文——關於最佳化殘差連結的 「mHC」 以及 AI 記憶模組 「Engram」,極有可能被整合進「MODEL1」的架構中,從而解決長上下文記憶和計算效率的核心痛點。此前有傳聞稱,DeepSeek 計畫在 2 月中旬(春節前後) 發佈下一代旗艦模型 V4。此次 GitHub 程式碼的提前部署,在時間線上與該傳聞高度吻合。如果屬實,這將是繼 R1 之後,DeepSeek 推出的第二個重要模型。值得一提的是,全球最大的 AI 開源社區 Hugging Face 最近也專門發文復盤了 R1 發佈這一年的影響,核心觀點就是「中國 AI 真的站起來了」。他們認為 R1 的出現是個分水嶺,證明了那怕算力受限,靠開源也能實現技術上的彎道超車,讓中國 AI 產業從封閉走向了開源爆發。在他們看來,R1 的真正價值在於降低了門檻:技術上: 公開推理細節,讓高級能力可復用。 ·應用上: 寬鬆協議(MIT)讓模型迅速融入商業落地。心理上: 建立了中國 AI 從「追隨」到「引領」的自信。 2025 年,中國開源模型的下載量在全球都佔據了主導地位,不僅國內的大廠和創業公司都在全面擁抱開源,甚至國外現在很多所謂的新模型,實際上都建立在中國開源模型的基礎之上。附上部落格地址:https://huggingface.co/blog/huggingface/one-year-since-the-deepseek-moment2. 復刻「春節突襲」DeepSeek 似乎偏愛在農曆新年這個時間節點搞事情。有消息透露,DeepSeek 計畫在 2 月中旬(農曆新年前後)發佈新一代旗艦模型 V4。去年的 R1 也是在這個時間節點發佈,隨後在春節假期引爆了全球關注。不得不說,這種時機選擇避開了歐美科技圈的常規發佈擁堵期,還充分用到了長假期間使用者的嘗鮮心理,確實能為病毒式的傳播埋下種子。3. 核心能力是卷程式碼和超長上下文在通用對話已經趨於同質化的今天,V4 選擇了一個更硬核的突破口:生產力等級的程式碼能力。據接近 DeepSeek 的人士透露,V4 並沒有止步於 V3.2 在基準測試上的優異表現,而是在內部測試中,讓其程式碼生成和處理能力,直接超越了 Anthropic 的 Claude 和 OpenAI 的 GPT 系列。更關鍵的是,V4 試圖解決當前程式設計 AI 的一大痛點:「超長程式碼提示詞」的處理。這意味著 V4 不再只是一個幫我們寫兩行指令碼的助手,它試圖具備理解複雜軟體項目、處理大規模程式碼庫的能力。為了實現這一點,V4 也改進了訓練流程,確保模型在處理海量資料模式時,不會隨著訓練深入而出現「退化」。4. 關鍵技術:Engram比起 V4 模型本身,更值得關注的是 DeepSeek 在上周聯合北京大學團隊發表的一篇重磅論文。這篇論文揭示了 DeepSeek 能夠在算力受限下持續突圍的真正底牌,是一項名為 「Engram(印跡/條件記憶)」 的新技術。HBM(高頻寬記憶體)是全球 AI 算力競爭的關鍵領域之一,當對手都在瘋狂囤積 H100 顯示卡來堆記憶體時,DeepSeek 再次走了一條不尋常的路。計算與記憶解耦: 現有的模型為了獲取基本資訊,往往需要消耗大量昂貴的計算力來進行檢索。Engram 技術能讓模型高效地查閱這些資訊,而不需要每次都浪費算力去計算 。省下來的寶貴算力,被專門用於處理更複雜的高層推理。研究人員稱,這種技術可以繞過視訊記憶體限制,支援模型進行激進的參數擴張,模型的參數規模可能進一步擴大。在顯示卡資源日趨緊張的背景下,DeepSeek 的這篇論文好像也在說,他們從未把希望完全寄託在硬體的堆砌上。DeepSeek 這一年的進化,本質上是在用反常識的方式,解決 AI 行業的常識性難題。它一年進帳 50 億,能夠用來訓練出上千個 DeepSeek R1,卻沒有一味卷算力,卷顯示卡,也沒有傳出要上市,要融資的消息,反而開始去研究怎麼用便宜記憶體替代昂貴的 HBM。過去一年,它幾乎是完全放棄了全能模型的流量,在所有模型廠商,每月一大更,每周一小更的背景下,專注推理模型,一次又一次完善之前的推理模型論文。這些選擇,在短期看都是「錯的」。不融資,怎麼跟 OpenAI 拼資源?不做多模態的全能應用,生圖生視訊,怎麼留住使用者?規模定律還沒失效,不堆算力,怎麼做出最強模型?但如果把時間線拉長,這些「錯的」選擇,可能正在為 DeepSeek 的 V4 和 R2 鋪路。這就是DeepSeek的底色,在所有人都在卷資源的時候,它在卷效率;在所有人都在追逐商業化的時候,它在追逐技術極限。V4 會不會繼續這條路?還是會向「常識」妥協?答案或許就在接下來的幾周。但至少現在我們知道,在 AI 這個行業裡,反常識,有時候才是最大的常識。下一次,還是 DeepSeek 時刻。 (愛范兒)
Hugging Face 特別發文:DeepSeek 時刻一周年,中國 AI 改變了什麼?
昨天,全球最大的 AI 開源社區 Hugging Face(抱抱臉) 發佈了他們中國開源系列的首篇文章:“DeepSeek 時刻”一周年。圖:Hugging Face 的文章如果說 2023 年是“ChatGPT 時刻”,那麼在 Hugging Face 的眼中,2025 年,無疑是屬於中國開源 AI 的“DeepSeek 時刻”。這篇報告不僅復盤了過去這一年中國 AI 的“狂飆突進”,更揭示了一個讓無數開發者振奮的事實:攻守之勢,已經異也。我們一起來看看這篇有意思的復盤文章。01 為什麼是“DeepSeek 時刻”?把時鐘撥回到一年前,2025 年的 1 月。當時,杭州的一家 AI 公司——DeepSeek(深度求索),扔出了那個後來改變一切的 R1 模型。在 Hugging Face 看來,這不僅僅發了一個新模型,而是中國 AI 發展史上的一個分水嶺。因為資料記錄下了一個歷史性的轉折點:這是中國開源模型,第一次真正殺進全球主流排行榜。而且這一進就收不住了。R1 迅速超越了 Llama 等西方頂流,成為了 Hugging Face 歷史上獲贊最多的模型。看看現在的榜單,曾經被美國開發者的名字霸屏的時代,終結了。圖:獲贊最多的模型在隨後的一整年裡,R1 更是成了全球 AI 界的“度量衡”:任何新模型發佈,都要拿來跟它比一比。它不再是追隨者,它成了標竿。報告中有一段非常精彩的論述:“R1 的發佈給了中國 AI 發展最寶貴的東西:時間。”在此之前,很多企業在“開源還是閉源”之間搖擺不定,受困於算力瓶頸。但 R1 的出現,用事實證明了:即便算力有限,只要路線對、迭代快,中國依然可以彎道超車。Hugging Face 總結了 R1 掃清的三個“障礙”:技術門檻碎了: 公開推理路徑,把“推理”變成了人人可用的工程模組。應用門檻碎了: MIT 協議一出,直接商用,大家不再捲跑分,開始卷落地。心理門檻碎了(這點最關鍵): 報告用了 "Psychological" 這個詞。翻譯成大白話就是:中國開發者的“心魔”破了。 我們不再問“能不能做?”,而是開始問“怎麼做得比別人好?”。我們中國人說,破山中賊易,破心中賊難。這種自信的回歸,才是“DeepSeek 時刻”真正的靈魂。02 被“倒逼”出來的黃金時代R1 點了一把火,隨後的 2025 年,中國 AI 界發生的事情,被 Hugging Face 稱為“有機的生態爆發”。這篇報告不僅誇了 DeepSeek,更點名表揚了百度、騰訊、字節、阿里等大廠。資料顯示,百度在 HF 上的發佈數量從 0 飆升到 100+,其他大廠也是數倍增長。(阿里、字節發佈數量翻了 8~9 倍)圖:HF 統計的中國公司的模型倉庫增長情況而 Kimi K2 的發佈,更是被譽為“另一個 DeepSeek 時刻”。更狠的還在後面。這些模型發出來不是當擺設的。報告顯示,在所有發佈不滿一年的新模型中,中國模型的總下載量已經超越了包括美國在內的任何其他國家。圖:中國模型的下載數量超過了任何其他國家智譜 AI(Zhipu AI)的 GLM、阿里的 Qwen,已經不滿足於發發權重了,他們開始建構完整的工程系統和介面。每周 Hugging Face 上“最受歡迎”和“下載最多”的榜單裡,中國模型幾乎成了常駐嘉賓。圖:中國開源模型熱力圖這裡有一句非常有意思的評論:“中國玩家們的協同,不是靠簽協議,而是靠‘制約’。”什麼意思?就是說在同樣的算力限制、合規要求和成本壓力下,大家“被迫”默契地走上了同一條高效的工程化道路。這聽起來有點“內卷”的苦澀,但資料證明:這種高強度的競爭,捲出了一個生命力極強、甚至開始反超美國的生態。我們不僅在發模型,更是在定義標準。03 全球反轉:現在,輪到西方“找替補”了文章最讓我感到魔幻現實主義的部分,是關於全球反應的描述。曾幾何時,我們是西方的學徒。但“DeepSeek 時刻”一年後的今天,世界變了。這種變化,連大洋彼岸的巨頭都坐不住了。就在上周,微軟(Microsoft) 發佈了《2025 全球 AI 普及報告》,將 DeepSeek 的崛起列為 2025 年“最意想不到的發展之一”。微軟在這份報告裡揭示的資料,非常讓人意外:在非洲:DeepSeek 的使用率是其他地區的 2 到 4 倍。原因很簡單:免費、開源。它沒有昂貴的訂閱費,也不需要信用卡,徹底打破了矽谷設下的“付費牆”。在被西方忽略的角落:資料顯示,DeepSeek 在國內份額高達 89%,在白俄羅斯達到 56%,在古巴也有 49%。圖:DeepSeek 全球市佔率分佈微軟不得不承認一個扎心的事實:AI 的普及不僅僅取決於模型有多強,更取決於誰能用得起。這種“農村包圍城市”的勝利,讓西方開發者徹底破防。Hugging Face 報告指出,現在許多美國初創公司已經默認使用中國開發的模型作為基座。甚至出現了“套殼”反轉:美國發佈的 Cogito v2.1(號稱領先的開放權重模型),其實就是 DeepSeek-V3 的微調版。甚至有一個美國的項目叫 ATOM (American Truly Open Model),他們的立項動機竟然是:“看到 DeepSeek 和中國模型太強了,我們必須奮起直追”。看到這裡,我真的忍不住想笑。曾幾何時,這是我們的台詞啊。04 暴風雨前的寧靜:DeepSeek 的“瘋狂一月”如果你以為 DeepSeek 在發完 R1 後就躺在功勞簿上睡大覺,那你就大錯特錯了。就在 DeepSeek 時刻一周年即將到來的這段時間(從元旦開始),這家公司的一系列“反常”動作,讓敏銳的技術圈嗅到了一絲暴風雨將至的味道。動作一:清理“技術債”,R1 論文一夜暴漲 60 頁就在不久前,有開發者發現 DeepSeek 悄悄更新了那一年前發佈的 R1 論文。這一更不得了,頁數直接從 22 頁暴漲到了 86 頁!他們把過去這一年裡所有的訓練細節、失敗嘗試、甚至那些不為人知的“坑”,全部毫無保留地補全了。這在行業裡通常只有一個解釋:這一頁翻篇了,我們要去搞更牛的東西了。動作二:底層架構大換血緊接著,DeepSeek 密集甩出了兩篇重磅新論文:《mHC》和《Engram》。看不懂沒關係,你只需要知道這兩篇論文想幹什麼——他們在試圖重寫大模型記憶和思考的方式。特別是 Engram,它想讓模型擁有“即時查閱記憶”的能力。這意味著,未來的模型可能更小、更快,但更聰明。動作三:GitHub 裡的神秘程式碼“MODEL1”昨晚又引起大家關注的,是眼尖的網友在 DeepSeek 更新的 GitHub 程式碼庫裡,扒出了一個疑似新模型的代號——“MODEL1”。圖:DeepSeek 程式碼庫洩露的 MODEL 1這個不起眼的變數名,現在已經被各路大神盤包漿了。大家都在猜,這會不會就是傳說中即將要在春節期間發佈的 DeepSeek V4?“DeepSeek 的每一次沉默,通常都意味著一次更大的爆發。”種種跡象表明,2026 年的春節,大機率又不會平靜了。寫在最後Hugging Face 這篇報告的結尾,預測 2026 年將會有更猛烈的爆發,尤其是在架構和硬體的選擇上,中國公司將繼續通過開源生態施加影響。回顧這魔幻的一年,從 DeepSeek R1 的驚天一雷,到百模大戰的全面開源,再到如今 Hugging Face 官方以“DeepSeek Moment”為題來記錄歷史。這不僅僅是技術的勝利,更是開源精神在東方的勝利。我們不再是跟隨者,我們已經坐在了牌桌的主位。2026,好戲才剛剛開始。 (AI范兒)
DeepSeek-R2要來了?
DeepSeek-R1發佈一周年之際,核心演算法庫驚現MODEL1,是V4還是R2?2025年1月20日,DeepSeek-R1正式發佈。從此,國產大模型第一次走到了全球舞台的核心位置,開啟了開源時代。而就在今天深夜,開發者社區沸騰了:DeepSeek的一個儲存庫進行更新,引用了一個全新的「model 1」模型。DeepSeek-R1一年了,但DeepSeek-R2還沒來。而這個被爆出的MODEL1,極有可能就是R2!在DeepSeek的開放原始碼專案FlashMLA庫程式碼片段明確引用了「MODEL1」,並且伴隨針對KV快取的新最佳化,和576B步幅的稀疏FP8解碼支援。FlashMLA是DeepSeek的最佳化注意力核心庫,為DeepSeek-V3和DeepSeek-V3.2-Exp模型提供支援。項目裡,大約有28處提到model 1。這可以被解讀為新模型即將發佈的明確訊號。巧的是,這個爆料正好趕在DeepSeek-R1發佈一周年(2025年1月20日)。R1作為開源推理模型,曾匹敵OpenAI o1並登頂iOS App Store,此後徹底改變了開源AI社區。MODEL1即便不是R2,也意義非凡,畢竟FlashMLA是DeepSeek最佳化的注意力核心演算法庫。FlashMLA是DeepSeek為Hopper架構GPU(如H800)最佳化的MLA(Multi-head Latent Attention)解碼核心。在推理層程式碼中提及新模型ID,往往意味著該新模型(代號為Model1)將繼續復用或改進現有的MLA架構。這表明 DeepSeek 團隊正緊鑼密鼓地推進新模型的推理適配工作,FlashMLA 作為其核心推理最佳化的地位依然穩固。過去,DeepSeek的確遇到了一些麻煩。本月15日,國外媒體報導,去年在研發其新一代旗艦模型時,DeepSeek在算力上碰到了一點麻煩。但DeepSeek及時調整了策略,取得了進展,並正準備在「未來幾周內」推出這款新模型。HuggingFace:DeepSeek如何改變開源AIHuggingFace在DeepSeek R1發佈一周年之際,發文解釋了DeepSeek如何改變了開源AI。R1並不是當時最強的模型,真正意義而在於它如何降低了三重壁壘。首先是技術壁壘。通過公開分享其推理路徑和後訓練方法,R1將曾經封閉在API背後的高級推理能力,轉變為可下載、可蒸餾、可微調的工程資產。許多團隊不再需要從頭訓練大模型就能獲得強大的推理能力。推理開始表現得像一個可復用的模組,在不同的系統中反覆應用。這也推動行業重新思考模型能力與計算成本之間的關係,這種轉變在中國這樣算力受限的環境中尤為有意義。其次是採用壁壘。R1以MIT許可證發佈,使其使用、修改和再分發變得簡單直接。原本依賴閉源模型的公司開始直接將R1投入生產。蒸餾、二次訓練和領域適應變成了常規的工程工作,而非特殊項目。隨著分發限制的解除,模型迅速擴散到雲平台和工具鏈中,社區討論的重點也從「那個模型分數更高」轉向了「如何部署它、降低成本並將其整合到實際系統中」。久而久之,R1超越了研究產物的範疇,成為了可復用的工程基礎。第三個變化是心理層面的。當問題從「我們能做這個嗎?」轉變為「我們如何做好這個?」時,許多公司的決策都發生了變化。對中國AI社區而言,這也是一個難得的、獲得全球持續關注的時刻,對於一個長期被視為跟隨者的生態系統來說,這一點至關重要。這三個壁壘的降低共同意味著,生態系統開始獲得了自我複製的能力。DeepSeek-R1一周年今天,讓我們回到原點,回顧DeepSeek-R1誕生的一年。在R1之前,大模型的進化方向幾乎只有一個,更大的參數規模、更多的資料……但是,模型真的在思考嗎?這個問題,就是DeepSeek-R1的起點。它不是讓讓模型回答得更快,而是刻意讓它慢下來,慢在推理鏈條的展開,慢在中間狀態的顯式表達。從技術上看,DeepSeek-R1的關鍵突破,並不在某一個單點技巧,而在一整套系統性設計。推理優先的訓練目標在傳統SFT/RLHF體系中,最終答案的「正確性」是唯一目標。R1 則引入了更細粒度的訊號。這也是第一次,模型高密度推理資料,而非高密度知識R1的訓練資料,不追求百科全書式的覆蓋,而是高度聚焦在數學與邏輯推導、可驗證的複雜任務。總之,答案不重要,過程才重要。因此,R1才在數學、程式碼、複雜推理上,呈現出「跨尺度躍遷」。推理過程的「內化」,而不是復讀範本一個常見誤解是:R1隻是「更會寫CoT」。但真正的變化在於:模型並不是在復讀訓練中見過的推理範本,而是在內部形成了穩定的推理狀態轉移結構。從此,推理不再是外掛,而是內生能力。一年之後:R1改變了什麼?首先,它改變了對「對齊」的理解。R1之後,我們開始意識到,對齊不僅是價值對齊,也是認知過程的對齊。第二,它改變了我們對開源模型的想像空間。R1證明:在推理維度,開源模型不是追隨者,而可以成為範式定義者。這極大啟動了社區對「Reasoning LLM」的探索熱情。第三,它改變了工程師與模型的協作方式。當模型開始「展示思路」,人類就不再是提問者,而是合作者。回到今天:R1仍然是一條未走完的路。一周年,並不是終點。我們仍然清楚地知道:推理能力還有明顯上限,長鏈路思考仍然昂貴但正如一年前做出 R1 的那個選擇一樣——真正重要的,不是已經解決了什麼,而是方向是否正確。DeepSeek-R1的故事,還在繼續。而這一年,只是序章。 (新智元)
腦機介面第一股來了,“DeepSeek時刻”還沒來
腦機介面賽道,大動作不斷。先是,馬斯克旗下的腦機介面公司Neuralink宣佈在2026年將進行大規模生產,之後“杭州六小龍”之一的強腦科技完成20億元融資,緊接著又馬不停蹄地以保密形式向港交所提交IPO申請……種種跡象表明,腦機介面站上了風口。資本青睞腦機介面,是偶然還是必然?腦機介面何時可以迎來“DeepSeek時刻”?商業化落地,腦機介面還面臨那些挑戰?不再是科幻概念嚴格來說,腦機介面並非新鮮事物。早在1973年,“人類意識可以直接轉化為機器能夠理解的指令”這一現象被科學家發現,從而提出了腦機介面這個概念。所謂腦機介面,是一種變革性的人機互動技術,其作用機制是繞過外周神經和肌肉,直接在大腦與外部裝置之間建立全新的通訊與控制通道,可以應用於運動重建、言語回歸、視覺恢復、認知強化等場景。圖源:Nature Medicine通俗易懂地說,腦機介面重構了生命終點的敘事。不過,早期的腦機介面存在理論薄弱、電極不穩、手術複雜、效率低下等一系列棘手的問題,長期處於前沿科技的序列中。以至於,腦機介面明明是科學術語,卻成為科幻的大殺器。最為典型的案例,就是《駭客帝國》中人類通過腦機介面與矩陣系統相連,從而在虛擬與現實之中來回穿梭。儘管如此,圍繞腦機介面的研究一直在持續。盛大集團創始人陳天橋曾表示:“腦機介面不是賺錢風口,投資腦機介面是一件長期耐心的事。”直到近些年,腦機介面才真正打開了生命重構的大門。在大洋彼岸,Neuralink在細分的侵入式腦機介面領域有了重大突破,新一代手術機器人將單根電極植入時間從17秒縮短至1.5秒,深度突破50毫米,已累計開展12例臨床研究,覆蓋漸凍症、脊髓損傷等重大頑疾,目前全球排隊人數已超過1萬。圖源:Neuralink馬斯克表示:“我們正在開發通用的大腦輸入輸出技術,探索如何將資訊輸入大腦、從大腦中獲取資訊,同時又不會對大腦造成損傷或產生任何副作用。”與Neuralink不同,強腦科技走的是非侵入式路線。非侵入式技術無需開顱手術,只需通過頭皮即可採集腦電訊號,進而幫助延緩記憶力、注意力等認知功能的衰退。更為重要的是,非侵入式在醫療之外,還可以與遊戲等文娛場景結合,為文娛場景提供更真實的沉浸感,從而謀求更大的商業空間。以三七互娛為例,正在將自研的孤獨症輔助訓練遊戲《星星生活樂園》與腦機介面裝置結合,以尋找遊戲產業的新機遇。正因為如此,強腦科技成為僅次於Neuralink的全球第二大腦機介面獨角獸。落地才是真正的挑戰由上可見,腦機介面成為資本市場的“香餑餑”。摩根士丹利預測,到2045年僅美國醫療市場的腦機介面規模就高達4000億美元,整體市場空間有望突破兆美元。此背景下,A股的腦機介面類股氣勢如虹,被投資者津津樂道。圖源:同花順問題在於,無論是Neuralink還是強腦科技,都共同面臨三大挑戰,如若不能成功解決痛點,腦機介面就難以真正從夢想走進現實。首先,技術尚未成熟。雖然腦機介面技術不斷迭代,但遠遠談不上成熟,要從能用走向好用,必須在訊號採集、解碼演算法、醫療康復等方面再進一步。譬如,人類的大腦有800億至1000億個神經元,每個神經元又與上萬個其他神經元連接,目前的電生理技術一次最多隻能記錄1000個神經元,高效採集訊號還需要久久為功。此外,主流演算法在面對情感、情緒等意圖時,仍然力不從心。再譬如,侵入式腦機介面需要開顱植入電極,如何避免電極被感染以及長時間穩定工作,是一個嚴峻的考驗。“腦極體”表示:“植入物作為異物,會引發人體的免疫反應,導致電極周圍形成疤痕組織,從而影響訊號質量,使裝置失效。”基於此,相關規劃頗為穩健。《腦機介面未來產業培育行動方案(2025—2030年)》提出,到2027年推動5款以上侵入式、半侵入式產品完成臨床試驗,到2030年實現腦機介面產品的全面臨床應用。而醫療之外的領域,同樣不容樂觀。廣發證券表示:“腦機介面的醫療級應用獲批預計還需3年~5年,而消費級產品則普遍面臨‘佩戴笨重、使用者黏性不足、價格偏高’等痛點,要真正從‘有趣’走向‘有用’,必須跨越隱性化、剛需化和成本可控三大門檻。”其次,成本亟需降低。公開資料顯示,腦機介面所需費用包括15萬至35萬元的植入裝置、數千元至數萬元的手術支出以及後續的康復保養等。《中國商報》表示:“目前國內尚未形成成熟、穩定的專項供應鏈,多數核心部件需企業自主研發或定製,顯著延緩量產進度並增加成本。”不難看出,腦機介面產品成本高企。腦機介面要普及,降低成本是必由之路,否則只能服務少數人,這樣既不利於社會的公平性,也不利於產業健康發展。向資本借力,成為腦機介面企業擴大產能、攤低成本的共同選擇。Neuralink完成了E輪融資,籌措了6.5億美元;強腦科技完成了Pre- IPO輪融資,籌措了20億元人民幣;階梯醫療完成了B輪融資,籌措了3.5億元人民幣……由此一來,企業也有了更大的野望。強腦科技創始人兼CEO韓璧丞表示:“未來5到10年,我們計畫幫助100萬肢體殘障人士重獲行動自由,並協助1000萬阿爾茨海默病、孤獨症及失眠患者進行康復。”需要注意的是,地方也將腦機介面服務納入醫療服務價格體系,並為侵入式置入費、侵入式取出費、非侵入式適配費設定了價格,從另外一個維度助力降本。再次,必須保護隱私。腦機介面落地離不開記錄、讀取、分析、反饋大腦的資料,這些資料可能涉及記憶、情感、慾望等領域,屬於個人隱私的範疇。一旦潛意識的內容暴露,可能會帶來不必要的尷尬與麻煩。一名業內人士表示:“我們採集的腦電資料歸誰所有?如何防止被濫用或篡改?需要法律、倫理及技術標準共同建構保障機制。”更為麻煩的是,腦機介面演化為“腦聯網”之後,也不排除廣告騷擾、駭客攻擊等不良行為隨之而來,需要提前做好準備。一言以蔽之,腦機介面要想走得更遠,既要用好資料,也要保護好資料。總而言之,腦機介面是一個新興的藍海市場,既可以幫助病人、老人等重返社會,又可以賦能互動革命,提升社會效率與迭代生活方式,但是還有許多功課要補,才可以真正進入商業化階段。從這個角度來看,腦機介面第一股只是序章。 (創業邦)
DeepSeek震撼一年後:中國“非EUV路線”創新!
2025年1月,國產大模型DeepSeek-R1橫空出世,以28nm晶片+光子互聯實現千億參數訓練,被外媒稱為“中國AI最深度突圍”。一年之後,ICIS今日發佈長文對比中美AI競賽最新態勢:中國在論文高被引、開源模型數量上已反超美國;但在尖端算力、EDA/IP和2nm以下晶片仍落後約半代,整體技術差距從2024年的12個月壓縮至約6個月,進入“貼身肉搏”階段。史丹佛HAI資料顯示,2025年全球AI高被引論文前1%中,中國機構佔比29.8%,首次超過美國(29.4%)。DeepSeek、阿里、百度、華為、字節跳動五家合計開源67個十億級以上模型,同期美國Meta、OpenAI、Google僅開源43個。DeepSeek-R1在數學推理榜單AIME2025上得分與GPT-4.5持平,訓練成本僅為後者1/18。美國BIS自2024年10月將HBM3E、CoWo-S納入對華管制,中國被迫轉向成熟工藝+Chiplet+光子互聯。DeepSeek團隊披露,其最新兆模型使用國產14nm+28nm混合Chiplet,HBM2E國產替代率60%,訓練算力成本下降40%,但單卡性能仍比H100低35%。ICIS援引分析師指出,若2026年國產HBM3E順利量產,中美算力硬體差距有望從1.5代縮小至半代。2025年中國AI領域股權融資達260億美元,佔全球37%,僅次於美國。清華、北大、浙大AI專業本科招生人數三年翻倍,2026屆畢業生預計超4萬人。DeepSeek母公司幻方量化設立10億元“算力獎學金”,被業內稱為“中國版OpenAI Grants”。ICIS測算,2026年國產HBM將拉動中國高純硫酸、銅電鍍液需求增長22%,光刻膠消費量突破1.2萬噸,年復合增速18%。美國限制ArF光刻膠對華出口,促使南大光電、上海新陽加速研發,2025年國產ArF光刻膠驗證線已通過28nm工藝考核,目標2027年匯入14nm。報告認為,中國在AI工程化、資料規模和政府集聚度上具備優勢,但2nm以下GPU、EDA/IP、先進封裝仍受制;美國則依靠CUDA生態、2nm GAA和High-NA EUV保持半代領先。若2027年中國仍無法量產EUV級GPU,技術差可能重新被拉大至12個月。DeepSeek一周年表明,封鎖並未阻止中國AI崛起,反而加速“非EUV路線”創新。6個月的技術差已進入“同一世代”競爭,誰能率先在下一代2nm GAA、光子計算和開源生態上突破,誰就能定義2027年後的AI新格局。對於仍在擴產中的國產HBM、光刻膠與裝置企業而言,DeepSeek打開的窗口期,只爭朝夕。 (晶片行業)
【CES 2026】2026開年科技大戲,誰來照亮CES?|| 大視野
有一些時刻註定會載入史冊。2025年初,DeepSeek時刻爆發,證明在AI時代,中國的新興大模型企業可以憑藉低成本、高性能和易用的創新開源模型,加速AI在全球範圍尤其是南方國家的普及。2026年1月6日,拉斯維加斯,在全球開年科技大戲CES(消費電子展)開幕首日,1.5萬多名科技領域從業者湧入全球首座全沉浸式球幕場館Sphere(天球館),參加聯想集團的創新科技大會(TechWorld)。大會下午5點正式開始,但下午1點多就開始排隊,一票難求。會上,聯想集團重磅發佈了面向全球的首款個人超級智能體Lenovo Qira和業界最全面的推理最佳化伺服器產品組合。Qira作為跨平台、跨裝置的AI終端入口,能將使用者的手機、電腦、平板、可穿戴裝置等不同終端裝置連接起來,高效執行任務;能憑藉情景感知能力,記住使用者偏好,預判使用者需求,以使用者期待的方式互動、完成各項任務,並保護隱私;還能連接、協調多個AI智能體,整合知識,形成洞察,並最終成為使用者的“個人AI雙胞胎”。作為AI時代首家在CES發表主題演講的中國科技企業,聯想集團董事長兼CEO楊元慶全面闡釋了“混合式AI”的含義,並展示了涵蓋AI PC、智慧型手機、可穿戴概念產品Maxwell、智能眼鏡等在內的新一代智能裝置,全面整合的AI基礎設施與解決方案,以及與Sphere、FIFA(國際足聯)在娛樂、體育領域的合作成果。| 聯想集團董事長兼CEO楊元慶和國際足聯主席詹尼·因凡蒂諾‌(Gianni Infantino)如果說前兩年全球AI最顯著的特徵是“大模型的寒武紀大爆發”,2026年的CES和Tech World表明,AI正從雲端走向身邊,從虛擬世界走向現實世界,從“雲端訓練”走向“邊緣推理”,從“提示詞工程”“聊天機器人”走向“智能體”“AI雙胞胎”,從靜止不變的硬體到能與使用者互動、可根據使用者位置和視線自動旋轉調整的“響應式AI終端”。無論是大模型時代的DeepSeeK時刻,還是AI開始全面落地應用的聯想時刻,中國科技企業都做出了令世界矚目的創造性回答。01 聯想時刻的三重內涵2026年的CES,聯想時刻為何如此閃亮?首先,作為一家植根中國、業務遍及180個國家和地區市場的全球智能裝置領導廠商,聯想集團用“混合式AI”這一中國方案,贏得了行業共識。當下,AI發展正處在一個新的爆發時刻,即從內容生成朝著感知三維空間、學習複雜邏輯、與現實世界深度互動的方向拓展。此時,整合了個人智能、企業智能與公共智能的混合式AI的提出,表明了聯想致力於打造個性化、多樣性AI,推動AI在全球普及普惠的雄心,也為全球AI發展提供了更具包容性的落地空間。聯想的混合式AI,和DeepSeek“推動人工智慧技術普惠化”的初衷異曲同工,都具有中國科技企業的鮮明特色。其次,聯想集團作為FIFA官方技術合作夥伴,首次系統展現了以混合式AI賦能世界盃的技術路徑,包括足球AI超級智能體、VAR(視訊助理裁判)3D數字人可視化方案,以及裁判視角AI視訊增強系統等。2026年美加墨世界盃足球賽不僅是史上規模最大的世界盃,也是歷上規模最大、複雜度最高的計算工程,對於AI的真實應用能力,可謂空前考驗。AI不是用來炫技的,是要解決實際問題的。FIFA選擇聯想來擔綱解決世界性計算難題,這證明了中國科技企業具備包含軟硬體和服務在內的綜合解決方案能力,以及在極限挑戰面前攻堅克難的響應能力。聯想的努力,也將為未來的大型體育賽事和在其他行業落地應用提供可參考、可沿用的AI路線範本。第三,聯想的Tech World大會,群賢畢至,精英雲集,彰顯出了植根於中國的全球性科技企業的影響力。輝達創始人兼CEO黃仁勳、英特爾CEO陳立武、AMD董事長兼CEO蘇姿丰、高通總裁兼CEO克里斯蒂亞諾·安蒙、FIFA主席因凡蒂諾,這些全球科技與體育領袖均在Tech World大會上發聲,顯示出全球科技界對聯想的行業地位和發展戰略的高度認同,這也是聯想長期遵循的“開放、包容、普惠、均衡、共贏”的新型經濟全球化理念的成功。當AI從虛擬世界到在全球真正落地應用,變成新的生產力工具和智能化的個人助手時,人們發現,作為PC銷量全球第一、每年為全球使用者提供數以億計的電腦、平板、智慧型手機等終端裝置的廠商,聯想成了輝達、英特爾、AMD、高通這些科技巨頭的公約數和共同選擇——輝達與聯想共同發佈了全新的“聯想人工智慧雲超級工廠”合作計畫,AMD與聯想攜手打造機架級AI基礎設施,英特爾與聯想共同開發Aura Edition系列、為使用者打造極致AI PC體驗,高通期待未來與聯想加速手機、智能眼鏡等可穿戴裝置等移動終端產品的創新。在物理AI的新時代,“理”離不開“物”,“物”是“理”的載體。因此,聯想這樣傳統被認為的硬體廠商,反而成了AI世界的樞紐和兵家必爭之地。02 為解決世界性難題而生:超級挑戰造就超強能力2010年南非世界盃1/8決賽,德國迎戰英格蘭。比賽前36分鐘,德國隊2:1領先。第37分鐘,英格蘭隊蘭帕德在大禁區線上遠射,擊中橫樑彈入網窩,德國隊門將諾伊爾立即將球撈出,當值主裁示意此球無效,而慢動作顯示球已經完全越過了門線。本可扳平比分的英格蘭隊回天無力,下半場又連丟2球,以1:4慘遭淘汰。FIFA創新總監霍爾茨穆勒在CES接受筆者採訪時說,長期以來,人們一直認為技術不應成為足球運動的一部分,“我們只需要22名球員、1名或多名裁判在球場上,還有球,就這麼簡單。”但德國對陣英格蘭那場比賽的誤判,顛覆了世界足壇,“我們開始在足球語言之外尋找另一種語言,即技術的語言”。2014年巴西世界盃,門線技術首次得到應用,當時採用了GoalControl系統,利用14台高速攝影機向資料間傳送數位照片,經過資料分析,再把結果傳送到裁判所戴的特殊手錶上。如果確定球過了門線,手錶上就會顯示“goal(進球)”。整個用時不到一秒鐘。2018年俄羅斯世界盃,引入了視訊助理裁判、數字身份識別與高畫質轉播。2022年卡達世界盃,應用了半自動越位技術(SAOT)和AI資料處理。2026年世界盃,是AI時代的首次世界盃。三國聯合舉辦,首次擴充至48支球隊,橫跨16座比賽城市,預計將有超過60億人次觀看,決賽更將吸引超過20億球迷的目光。要應對這樣的超級工程,聯想絕不是簡單的裝置供應商,而是要讓AI全面進入世界盃的“作業系統層”,參與決策、影響流程、支撐運行,並在極端複雜、高壓、零容錯、資料達到PB等級(相當於5000億頁文字)的環境中接受一切檢驗。這是一個“硬體+軟體+系統+AI能力”的大系統。為了打好本屆AI世界盃,聯想的技術團隊已經和FIFA合作了一年多,共同駕馭這一“人類級、星球級的事件型AI應用場景”。聯想通過感測器、電腦視覺與混合AI架構,建構出了覆蓋“感知-建模-預測-孿生”的“足球世界模型”,並與FIFA一起建構了賽事級的智能營運體系,通過智能指揮中心、數字孿生技術與AI生成的預測性規劃,將賽事物流、裝置調配、通訊協調與運行狀態納入統一的管理框架,以實現即時監測與動態決策。從技術角度看,聯想和FIFA在Tech World上聯合發佈的關鍵技術有三項。第一項是足球AI超級智能體(Football AI Pro)。它能協調多個智能體,梳理數百萬資料點,分析超過2000項不同指標,並迅速提供洞察,讓分析師可以即時對比球隊模式,利用視訊片段和3D虛擬形象將資料生動呈現;讓教練能夠預見其戰術調整在下一場對陣特定對手時的效果;讓球員可以獲得個性化的比賽分析。它還支援48支球隊的多語言互動,從技術上確保不同資源水平的球隊都能平等使用超級智能體,為“足球平權”奠定了落地基礎。第二項是VAR 3D數字人可視化方案。它通過AI驅動,能在瞬間完成球員拍攝與站姿判定,並基於高斯建模等技術,實現全自動、毫米級精度的3D重建,細節可還原至髮絲與皮膚紋理。這使得越位判罰能以真實比例、清晰細節的球員數字分身呈現,極大地增強了判罰的直觀性與公信力。第三項是裁判視角AI視訊增強系統。它將最終畫面延遲從FIFA要求的6秒,成功壓縮至2秒以內,讓觀眾得以沉浸於裁判的視野,彷彿親臨賽場、與球員並肩,放大了賽事帶來的共情與愉悅。其實,聯想在體育領域的AI佈局由來已久,從奧運會、F1®到FIFA,聯想集團是全球唯一集齊這三大頂級賽事技術合作的科技企業。頂級體育賽事對技術的穩定性、協同性與適應性有著極致要求,聯想正是在應對超級挑戰中培育了自己的超級能力。以世界一級方程式錦標賽®(F1®)中的技術合作為例,F1是全球範圍內最複雜的流動型賽事體系,每年需要完成24次大規模裝置遷移,每個比賽周末會傳輸約600TB的資料量,經處理後分發給全球180個地區的60家轉播機構,全程延遲需控制在0.15秒內。自2025年初起,聯想成為F1全球合作夥伴及全球技術合作夥伴,以覆蓋AI終端、AI基礎設施及領先服務的全方位創新佈局,為F1提供了一站式解決方案,確保賽事轉播在極端時間壓力下依然保持高品質輸出,並一直保持著“零故障率”。在Tech World上,F1與聯想宣佈正式在賽事基礎設施中部署聯想海神液冷技術,以應對F1在賽事轉播製作、賽事即時營運以及即時資料處理等方面對高性能計算能力的需求。海神液冷技術的部署,將使F1在顯著提升計算性能的同時,最高可將能效提升約40%,為覆蓋全球超過8.2億觀眾的賽事轉播體系提供更高效、更可持續的技術支撐。當你瞭解了聯想在全球頂級體育賽事的這些努力和創新,就會更加清楚為什麼它在全球科技圈有著獨特的地位,以及為什麼輝達、英特爾、AMD、高通等公司不約而同都和它形成了戰略合作關係。它是裝置供應商,又是方案整合者,還是解決世界性AI工程難題的創新服務提供商。03 用技術創新實現新文藝復興置身Sphere這座外部有5.4萬平方米LED螢幕、內部有1.5萬平方米環形LED螢幕的天球,全場感受Tech World的全方位沉浸式“AI科技春晚”體驗,我腦子裡跳出了一個關鍵詞——文藝復興。1997年,美國公共電視台(PBS)製作了一部90分鐘的關於矽谷的專題片,名字就叫《矽谷——百年文藝復興》,由著名電視節目主持人克朗凱特主持。片子展示了矽谷的發展歷程,勾勒出創造性的反叛文化和對約束性商業傳統的逃離,怎樣讓那些夢想家和發明者們承擔起巨大的風險,打造出電子工業的一個個傳奇。當時美國科技界有這樣一條宣喻:“古代的美索不達尼亞,15世紀的佛羅倫薩,20世紀的巴黎,20世紀末期的矽谷”。在2025年7月23日白宮發佈的《贏得競賽:美國人工智慧行動計畫》中,“文藝復興”一詞又出現了。該計畫的前言中,這樣寫道:“人工智慧將使人們能夠發現新材料、合成新化學物質、製造新藥物,並開發出新的能源利用方法——一場工業革命。它將帶來全新的教育、媒體和通訊形式——一場資訊革命。而且它還將帶來全新的智力成就——一場文藝復興。”“一場工業革命、一場資訊革命以及一場文藝復興——一切同時發生,這就是人工智慧所展現的潛力。”如果說AI將帶來一次融合了科技與文化、生產、生活的新文藝復興,CES就是它的風向標。用CES主辦方CTA(美國電子消費品製造商協會)CEO夏皮羅(Gary Shapiro)的話,CES是“世界上最大的創新事件”(the lagerest innovation event in the world),是一個帶來新發現、超越限制、綻放靈感的地方。對聯想集團來說,選擇2026年CES在Sphere天球館舉行創新科技大會,也是一次用AI技術所打造的文藝復興。沒有AI,Tech World不可能呈現出如此的體驗之美,沉浸之深。這也是聯想品牌與聯想文化的一次全球性閃耀。品牌的背後是文化,文化的背後是科技賦能。無論是聯想和頂級體育賽事的合作還是和Sphere的合作,事實上都是一種雙向奔赴——一邊是AI普惠的力量,一邊是人類永恆的體育精神和藝術表現力。而聯想由此而形成的能力——如跨域協同、即時調度、高可靠維運與個性化體驗生成,如系統整合、即時資料分析與軟硬一體交付,再加上在技術方面的創新力(如支撐混合式AI的智能模型編排、智能體核心、多智能體協作技術能力,Qira身上的隨時響應、全域執行、情境感知技術能力)——也將通過溢出效應在更多領域持續放大。在拉斯維加斯璀璨的科技光影中,在幾個月後的2026年FIFA世界盃綠茵場上,一個以混合式AI賦能千行百業、挑戰世界性計算難題、推動AI普及普惠的新聯想正在崛起——AI的世界需要聯想,聯想服務世界的AI。楊元慶說:“讓AI去解決人類的真實問題,才是讓AI變聰明的正確路徑。”以2026年CES和Tech World為標誌,聯想為中國科技企業贏得了一場世界性的喝彩。這是聯想新的光榮與夢想。也預祝聯想在撲面而來的AI大時代為中國和世界做出新的貢獻,展示創新普惠的新力量。 (秦朔朋友圈)