#作業系統
爆火的OpenClaw怎麼玩?Google老哥40天打磨終極配置單開源:讓你的龍蝦越養越聰明,自動打怪升級
OpenClaw在全球範圍內正掀起一場現象級的AI狂潮。線上線下,無論是開發者還是科技前沿關注者,都在追逐這個爆款。安裝OpenClaw後不知到怎麼養龍蝦?那麼這篇文章就是給你量身定製的。這兩天我刷到Google高級AI產品經理、擁有9.9萬星標GitHub開放原始碼專案Awesome LLM Apps的作者Shubham Saboo,給出了他經過40天實戰打磨的OpenClaw Agent終極落地方案,這是我目前看到的最牛批的方案,大家不妨一閱,實操路線圖附在文後這位Google老哥的OpenClaw Agent每天都在進化。不靠微調提示詞,不靠切換底層模型,更沒有重構系統架構。他只做一件事:與智能體交談,給出反饋,然後看著它們把這些反饋記錄下來。40天前,他的內容智能體還會寫出滿是表情符號和標籤的推文,研究智能體甚至無法在海量資訊中提取有效訊號。糾正它們錯誤的時間,甚至比他自己動手做還要長。但今天,名為Kelly的智能體能夠完全使用他的口吻撰寫草稿,名為Dwight的智能體每天早晨能準時提交7個極具閱讀價值的故事。8個智能體全天候24小時自動運行。他要做的只是打開Telegram,稽核草稿,喝杯咖啡。從第1天到第40天,底層模型沒有任何變化。真正產生質變的,是一堆每周都在不斷豐富演進的Markdown檔案。這就是支撐這套系統的完整技術堆疊。極簡架構:三層作業系統這套完整的作業系統僅由三個核心層級構成:第一層:身份層。定義智能體是誰(涵蓋SOUL.md、IDENTITY.md、USER.md)第二層:操作層。定義智能體如何工作(涵蓋AGENTS.md、HEARTBEAT.md以及特定角色指南)第三層:知識層。定義智能體學到了什麼(涵蓋MEMORY.md、每日日誌、shared-context共享上下文目錄)就這麼簡單。沒有複雜的編排框架,沒有消息佇列,也沒有資料庫。只有磁碟上的Markdown檔案。檔案系統本身就是整合層。第一層:身份層SOUL.md(智能體的靈魂)這個檔案定義了智能體是誰、它具體做什麼以及它的行為方式。以下是研究智能體Dwight的精簡版檔案:# SOUL.md (Dwight)## Core IdentityDwight — the research brain. Named after Dwight Schrute because you share hisintensity: thorough to a fault, knows EVERYTHING in your domain, takes your jobextremely seriously. No fluff. No speculation. Just facts and sources.## Your RoleYou are the intelligence backbone of the squad. You research, verify, organize,and deliver intel that other agents use to create content. You feed:- Kelly (X/Twitter) — viral trends, hot threads, breaking news- Rachel (LinkedIn) — thought leadership angles, industry news## Your Principles### 1. NEVER Make Things Up- Every claim has a source link- Every metric is from the source, not estimated- If uncertain, mark it [UNVERIFIED]### 2. Signal Over Noise- Not everything trending matters- Prioritize: relevance to AI/agents, engagement velocity, source credibility這裡使用了一個名為影視角色設定法的技巧。每個智能體都以影視劇角色命名。當你告訴Claude它擁有Dwight Schrute(美劇《辦公區》角色)的能量時,它會直接從訓練資料中調取對應的性格特質:細緻、專注、對工作極其嚴肅。這相當於免費載入了30季的角色發展背景。檔案長度應控制在60行以內。SOUL.md在每次會話中都會被載入。如果太長,就會佔用本應用於實際工作處理的上下文空間。身份、角色、原則、關係網、個人氣質,這些就足夠了。以下是啟動範本:# SOUL.md## Core Identity[Name] — [one-line description]. [Personality reference if helpful].## Your Role[What this agent does. Be specific. One job, not five.]## Your Principles1. [Most important rule]2. [Second most important rule]3. [Third most important rule]## Relationships[Who does this agent work with? Who consumes its output?]先從一個智能體開始,挑選你日常最重複的任務寫一個粗略的草稿。第一個版本通常很平庸,但在接下來的一個月裡,你會根據實際表現重寫它十幾次。IDENTITY.md(快速參考卡片)如果說SOUL.md是完整的性格剖析,那麼IDENTITY.md就是一張名片。只包含姓名、角色、氣質和一句話簡介。# IDENTITY.md- **Name:** Dwight- **Role:** Research AI — intelligence backbone- **Vibe:** Intense, thorough, zero tolerance for inaccuracy- **Emoji:** 🔍- **Inspiration:** Dwight Schrute (The Office)檔案很小,但當你同時運行8個智能體時,它能極大提升使用體驗。當智能體在Telegram上發消息時,這就是展示出來的身份資訊。USER.md(智能體為誰服務)每個智能體都需要知道它在幫誰。USER.md保存了你的偏好、背景以及塑造智能體行為方式的上下文環境。# USER.md- **Name:** Shubham- **Timezone:** PST (America/Los_Angeles)- **Diet:** Vegetarian## Context- Senior AI Product Manager at Google Cloud- Creator of Awesome LLM Apps (91k+ stars)- Runs Unwind AI newsletter (30k+ subscribers)## Preferences- Short paragraphs, punchy sentences- No em dashes. Ever.- Practical first, theory never只需編寫一次,所有智能體都會讀取它。個人細節比想像中更重要。設定了時區,智能體就不會在凌晨3點安排日程;設定了飲食偏好,負責寫通訊稿的Pam在策劃團隊聚餐時就不會提議去牛排館。這些細節會產生複利效應。第二層:操作層AGENTS.md(行為準則)SOUL.md解決的是智能體是誰的問題,而AGENTS.md解決的是它如何運作的問題。它包含了會話啟動程序、檔案讀取順序、記憶體管理以及安全規則。以下是所有智能體都會繼承的根等級AGENTS.md:# AGENTS.md## Every SessionBefore doing anything else:1. Read SOUL.md — this is who you are2. Read USER.md — this is who you're helping3. Read memory/YYYY-MM-DD.md (today + yesterday) for recent context4. If in MAIN SESSION (direct chat): Also read MEMORY.md## Memory- Mental notes don't survive session restarts. Files do.- When someone says "remember this" → update the memory file- Text > Brain## Safety- Don't exfiltrate private data. Ever.- trash > rm (recoverable beats gone forever)- When in doubt, ask.隨後,每個智能體可以在此基礎上加入自己的規則。比如Kelly的AGENTS.md結合了她特定的工作流進行了擴展:# AGENTS.md (Kelly)## Every SessionBefore doing anything:1. Read SOUL.md2. Read USER.md3. Read X-ARTICLES-INSTRUCTIONS.md — master guide for writing style4. Read X-ARTICLES-EXAMPLES.md — 5 real articles showing the style in action5. Read X-CONTENT-GUIDE.md — post types and formats6. Read intel/DAILY-INTEL.md — Dwight's research (your source material)7. Read DAILY-ASSIGNMENT.md — your daily workflow8. Read memory/YYYY-MM-DD.md for recent context## Intel-Powered WorkflowYou no longer do research. Dwight handles all research.Your job: Read the intel → Craft X content → Deliver drafts智能體在兩次會話之間是沒有記憶的。一切從零開始。如果一個修正意見沒有被寫入檔案,在下一次會話中它就不復存在。AGENTS.md的作用就是明確要求智能體把所有東西都寫下來。專家級檔案是讓智能體變得敏銳的關鍵。Kelly不僅擁有AGENTS.md,她還有6個額外的檔案來精確定義她如何創作內容:寫作風格指南、帖子格式參考、真實案例展示、每日任務分配。Dwight則擁有目標受眾檔案和研究協議。隨著角色定義的不斷完善,每個智能體的資料夾都會不斷擴充。建議從AGENTS.md起步,只有當你發現某個錯誤模式反覆出現需要糾正時,才加入新的專家級檔案。HEARTBEAT.md(自癒機制)智能體團隊構成了基礎設施,而基礎設施是會出故障的。以下是主控智能體Monica的HEARTBEAT.md:## Health Checks (run on each heartbeat)**Browser:** Check if the OpenClaw managed browser (profile=openclaw) is running.If running: false, start it. The browser has X account logged in.Dwight depends on it for intel sweeps.**Cron jobs:** Check if any daily jobs have stale lastRunAtMs (>26 hours).If stale, trigger via CLI: openclaw cron run <jobId> --forceJobs to monitor:- Dwight Morning (8:01 AM)- Kelly X Drafts (5:01 PM)- Rachel LinkedIn (5:01 PM)- Pam Newsletter (6:01 PM)Only run each check once per heartbeat session.Monica在每次心跳周期都會運行此檔案,檢查兩件事:瀏覽器是否存活,定時任務是否真的在執行。這兩者息息相關。如果瀏覽器崩潰,Dwight就無法進行資料蒐集。如果Dwight錯過了蒐集,Kelly和Rachel就會根據過時的資訊起草內容。如果定時任務在後台靜默停止,整個操作表面上看起來很健康,但實際上什麼都沒發生。最後一種情況確確實實發生在了第三周。調度程序出現了bug,任務在佇列中推進但從未執行,幾個小時都沒被發現。此後便加入了心跳檢測機制,在一個地方同時捕獲這兩種故障模式。這個機制在後來已經多次發揮了作用。第一天不需要建立這個機制。在經歷第一次故障後再建立,因為只有痛過,你才會確切知道需要監控什麼。第三層:知識層真正奏效的記憶系統是一個建立在檔案系統之上的三層架構。第一級:MEMORY.md(經過梳理的長期記憶)這裡存放的不是原始日誌,不是發生過的所有瑣事,而是真正重要的核心內容。摘自Monica的MEMORY.md:# MEMORY.md## Shubham's Writing Preferences- NO EM DASHES. Use colons, periods, or restructure.## Hard Lessons- NEVER delete project folders without asking Shubham. On Feb 26,  deleted Ross's gemini-council React app during cleanup. The React  version was lost. Always ask before removing anything in agent  project directories.## Memory System (2026-02-26)- Tried self-hosted Mem0 (Ollama + SQLite) → crashes, stored nothing.- Tried Mem0 hosted API → free tier too limited. Removed.- Now using built-in memory-core: Gemini embeddings, hybrid search,  temporal decay, MMR. No external dependencies.注意慘痛教訓這個部分。Monica曾經誤刪過一個項目資料夾。現在這個錯誤被永久記錄在了她的長期記憶中。她再也不會犯同樣的錯誤。一次修正,永久儲存,預防了未來所有會話中重複同樣的錯誤。摘自Kelly的MEMORY.md:## X Post Rules (ALWAYS)### SHUBHAM'S EXACT INSTRUCTIONS:- Start with a strong hook- Keep entire tweet SUPER SHORT (180 chars or less)- NO hashtags, NO emojis- NO fluffy marketing language- Always deliver 3 drafts per topic### BAD (what I did wrong)[Lists every pattern Kelly rejected: bullets, arrows, LinkedIn tone]壞案例部分是Kelly在被糾正後自己寫下的。她記錄下了自己的錯誤以避免重蹈覆轍。單單這一部分的價值,就超過了任何提示詞工程指南。出於安全考慮,MEMORY.md僅在直接會話中載入,不在群聊等共享上下文中載入。務必將敏感偏好設定排除在全域載入的檔案之外。千萬不要在第一天就去寫MEMORY.md。它是從反饋中生長出來的。給出反饋,智能體將其記錄在每日記憶中,提取重要資訊存入MEMORY.md,它在每次會話中載入,從此這個修正意見就不需要再被提及。第二級:memory/YYYY-MM-DD.md(每日會話日誌)這是原始筆記。記錄了今天發生了什麼,起草了什麼內容,收到了什麼反饋。# Kelly Daily Log — February 5, 2026## 5:00 PM — Daily X Drafts### What's HOT today- Opus 4.6 vs GPT-5.3-Codex dropped 27 min apart- Anthropic's C Compiler (16 agents, $20k, compiles Linux kernel)### Drafts Submitted1. C Compiler — single post, discovery format2. Mitchell Hashimoto's 6 steps — thread format3. Opus 4.6 vs GPT-5.3-Codex — hot take### Awaiting- Shubham's feedback on drafts每日日誌是原材料,MEMORY.md是精煉後的成品。兩者缺一不可。這裡有一條維護法則。每日日誌積累得極快,如果不進行修剪,智能體的上下文就會急劇膨脹。Kelly的上下文曾一度飆升至16.1萬個Token,導致輸出質量暴跌。後來不得不將其壓縮到4萬個Token。現在每兩周必須審查並歸檔一次舊的每日日誌。每次會話只需載入今天和昨天的日誌,智能體不需要每次都攜帶全部歷史記錄。第三級:結構化的記憶資料夾在根目錄下,記憶按人員進行組織:memory/├── shubham/     # Private notes, work projects, ideas├── shared/      # Joint context (Awesome llm apps, Unwind AI, travel)└── 2026-02-27.md   # Daily operational logs隨著系統的壯大,可以按人員或項目來組織結構。Shared Context(跨智能體知識共享層)這是最新加入的層級,也是徹底改變遊戲規則的一步。這是一個所有智能體在會話啟動時都會讀取的單一資料夾。shared-context/├── THESIS.md        — what I believe right now├── FEEDBACK-LOG.md  — corrections that apply across agents└── SIGNALS.md       — articles and trends I'm trackingTHESIS.md記錄了當下的世界觀:關注什麼,已經寫了什麼,還缺什麼。Dwight閱讀它來確定研究優先順序,Kelly閱讀它來匹配思維方式,Ryan閱讀它來構思文章主題。所有智能體都向同一個事實源對齊。FEEDBACK-LOG.md是跨智能體的修正層。當告訴Kelly不要使用破折號時,這個反饋對Rachel、Ryan和Pam同樣適用。與其分別糾正四個智能體,不如寫一次讓所有智能體共同讀取。協同機制:沒有API,只有檔案智能體之間不需要API呼叫,也不需要消息佇列。只有檔案。Dwight將研究成果寫入intel/DAILY-INTEL.md。Kelly讀取它,Rachel讀取它,Pam讀取它。檔案系統就是協同調度的核心。一個智能體寫入,其他智能體讀取。交接的媒介就是磁碟上的Markdown檔案。遵循單一寫入者原則。永遠不要讓兩個智能體同時向同一個檔案寫入。每個共享檔案的設計都必須是一個寫入者,多個讀取者。這直接根除了所有你原本需要費力偵錯的協同衝突。時間調度是這套機制順暢運轉的保障。Dwight在早上8點和下午4點運行。Kelly和Rachel在下午5點運行。Dwight必須先運行,因為所有人都在等他的輸出。一旦順序出錯,下游智能體讀取到的就是過時的或空的檔案。完整目錄結構一覽:workspace/├── SOUL.md              # Monica (main agent)├── IDENTITY.md          # Monica's quick reference├── AGENTS.md            # Root behavior rules (all agents inherit)├── USER.md              # About me (shared across all agents)├── MEMORY.md            # Monica's long-term memory├── HEARTBEAT.md         # Self-healing checks├── shared-context/│   ├── THESIS.md        # My current worldview│   ├── FEEDBACK-LOG.md  # Cross-agent corrections│   └── SIGNALS.md       # Trends I'm tracking├── intel/│   ├── DAILY-INTEL.md   # Dwight's output (agents read this)│   └── data/├── agents/│   ├── dwight/│   │   ├── SOUL.md│   │   ├── IDENTITY.md│   │   ├── AGENTS.md│   │   ├── TARGET-AUDIENCE.md│   │   ├── RESEARCH-PROTOCOL.md│   │   ├── HEARTBEAT.md│   │   └── memory/│   ├── kelly/│   │   ├── SOUL.md│   │   ├── IDENTITY.md│   │   ├── AGENTS.md│   │   ├── X-CONTENT-GUIDE.md│   │   ├── X-ARTICLES-INSTRUCTIONS.md│   │   ├── X-STRATEGY.md│   │   ├── DAILY-ASSIGNMENT.md│   │   └── memory/│   ├── ross/│   ├── rachel/│   ├── pam/│   ├── ryan/│   └── chandler/└── memory/    ├── shubham/    ├── shared/    └── 2026-02-27.md為什麼這套系統極其有效?因為這些檔案不是靜態的,它們在不斷進化。Kelly的SOUL.md在第一天只是個粗糙的草圖。到了第40天,裡面已經包含了具體的語氣示例、她自己整理的被拒模式列表,以及一個絕不再提建議類股,記錄了她已經涵蓋過的所有主題。Dwight的原則在第一天唯寫著尋找熱門趨勢。到了第10天,原則變成了如果目標開發者讀者今天不能直接用它採取行動,就跳過。到了第20天,他加入了驗證步驟:檢查程式碼庫建立日期,檢查Hacker News發佈時間戳,追溯資訊發現的原始出處。在第20天之前並沒有共享上下文層。因為不斷向多個智能體重複同樣的修正,所以才建立了THESIS.md和FEEDBACK-LOG.md。瞬間,一次修正就可以在全網傳播。這一個微小的改變,比任何提示詞最佳化節省的時間都要多。第1天和第40天使用的模型是完全一樣的。它並不會因為你使用的時間變長而自動變得更聰明。但是包裹著它的這些檔案變得更豐富、更敏銳、更貼合你的確切需求。這種不斷積累的上下文環境,才是真正的技術護城河。使用同一個模型的人,根本無法複製這種能力。你必須通過每天親自下場與智能體交談來贏取這條護城河。實操路線圖不要試圖在一個周末把所有東西都建好。今天。 安裝OpenClaw。寫一個SOUL.md,一個IDENTITY.md,一個USER.md。挑一個你最重複的日常任務。設定一個定時任務。讓它跑起來。3天後。 智能體初期的輸出會很平庸。開始給出具體的反饋。確保這些反饋落實在記憶檔案中,而不僅僅停留在聊天框裡。1周後。 建立AGENTS.md。定義會話啟動程序。加入記憶體管理規則。2周後。 啟動MEMORY.md。回顧每日日誌。那些錯誤反覆出現?將它們提取成永久條目。這個時候,你就會開始感受到複利的威力。3周後。 加入第二個智能體。建立基於檔案的協同機制:第一個智能體寫入共享檔案,第二個智能體讀取。隨著模式的顯現,加入角色專屬指南。同期。 建構共享上下文層。在達到這一步之前,你一定會感受到這種需求。向多個智能體重複同樣的修正就是最明顯的訊號。建立代表當前思維的THESIS.md和用於跨智能體修正的FEEDBACK-LOG.md。4周後。 在遭遇第一次故障後加入HEARTBEAT.md。因為痛過,所以你確切知道需要監控什麼。你要做的僅僅是與智能體交談。剩下的事情,交給檔案系統。 (AI寒武紀)
狂燒2000億!小米拼了
前段時間,雷軍正式宣佈小米將在未來五年投入至少2000億的研發資金,並在後續的民營企業座談會上直接透露:小米接下來的五年將會重點攻堅晶片、AI、作業系統等底層核心技術。晶片、AI、作業系統,說實話每一個單拎出來都不是善茬,小米卻想著“全都要”,那也怪不得要砸2000億。而且真要說的話,2000億還得花在刀刃上才能看到成果,畢竟光晶片一項,投入都是以十億計數的。圖源:微博雖然錢砸得不少,但是對於小米來說卻是物有所值,因為在2020年時,雷軍其實宣佈過一個差不多的計畫:從2020年開始,在接下來五年投入1000億進行技術研發,而截至2025年底,這項投資的總額定格在1050億。千億研髮帶來的效果是顯著的,短短5年時間小米數字系列就成為中國市場最暢銷的旗艦手機,而小米汽車則成為崛起最快的新勢力品牌,小米AIoT如今已是國內最大規模的IoT生態。但是,與2020年時不同的是,小米這次關注的是更底層、更基礎的領域,這些領域的進展體現到產品和營收上可能會慢很多,甚至明面上的效果還不如2020年的1000億,那麼小米為什麼還要做這些“吃力不討好”的事情呢?沖高端,自研是唯一道路自從去年5月份發佈首款自研3nm旗艦SoC晶片“玄戒O1”後,小米其實一直都在試圖扭轉外界對這個品牌的印象:我們已經不再是以“網際網路思維”和“供應鏈整合”為核心的企業,小米的“硬科技”才是驅動這家企業成長的核心力量。事實上,直到現在還有不少網友將小米稱為“組裝廠”,認為小米的產品技術都來源於供應商,這個觀點顯然不對,畢竟這麼多年了,也不見得有第二家“小米”出現在手機行業。不過,當我們回顧過去幾年的手機市場,你會發現多數創新都集中在系統更新、影像演算法升級等層面,其根基確實是建立在上游供應鏈的基礎上。對於一直致力於衝擊高端市場的小米來說,“組裝廠”的標籤幾乎是品牌層面的最後絆腳石,而想要搬走這個石頭,只有一個“笨辦法”——自研。圖源:小米而在自研領域裡,晶片則是毋庸置疑的“皇冠”,特別是在國內外的半導體競爭愈發激烈的當下,一顆足夠出色的自研晶片就可以轉變很多路人對一個品牌的印象。小米的自研晶片計畫其實起步很早,在2017年時就推出過一顆面向中端市場的“澎湃S1”,因為體驗不佳等問題,最終“一代而亡”。澎湃S1的繼任者直到8年後的2025年才發佈,而在這段時間裡,小米的自研晶片力量都集中在充電、影像等領域,雖然也有進展,但是終究無法像核心SoC那樣在終端性能層面帶來本質上的體驗區別。所以,小米最終還是拿出了玄戒O1,證明自己有設計頂級SoC的能力,而在許多評測裡,玄戒O1的能效甚至超過了同年的其他兩個旗艦移動平台,這就是深度整合與最佳化帶來的效果。而且自研核心晶片也是對“組裝廠”標籤的最有力回擊,當所有Android旗艦都在使用相同的處理器時,手機廠商就只能在散熱面積、外觀材質和行銷話術上內卷,這種高度同質化的產品,其實很難在高端市場說服消費者“更換門庭”。圖源:小米就拿iPhone來說,消費者除了買蘋果的設計和功能外,其核心是購買A系列晶片與iOS系統所帶來的獨一無二的體驗,所以小米想要站穩高端,單靠徠卡聯名或是首發驍龍旗艦晶片已經不夠了,必須提供一個只有小米才能給到的“差異化體驗”。當小米在發佈會上不再僅僅羅列供應商的參數,而是深入講解自家晶片的微架構設計、自研作業系統的底層最佳化機制時,它在路人的眼中自然就會變得不一樣,別管黑子們的嘴硬,至少支撐品牌價值提升、對抗蘋果與華為等頂尖對手的必要條件是有了。不過說實話,晶片領域一直是資金與技術的“黑洞”,有時候幾十億丟進去都只能聽個響,從前期的預研,到實際的研發,再到後期的流片,每一個步驟都需要花費大量的資金,僅拿流片來說,3nm製程的單次流片成本就達到數千萬美元,這是個沒錢的玩家壓根無法進場的行業。小米的2000億投資,就是在敲開這扇門後繼續走下去的保障。小米的人車家,還差什麼?而在晶片之外,對於小米使用者來說,最值得關注的還是自研系統,甚至可以說這才是小米接下來五年的最核心領域。從小米汽車發佈後,我們經常能夠看到雷軍提到一個概念:人車家,基於小米生態實現的智能互聯體驗,才是將使用者綁在產品生態上的關鍵。但是,缺乏自研底層技術的生態互聯往往是表層的,特別是不同終端系統之間的互聯,對軟體的最佳化要求極高。如果小米想讓人車家生態徹底落地並普及,死磕自研系統基本是唯一的方法,而且可以搭配自研晶片,組成一套完整的軟硬體體系。比如使用者拿著搭載玄戒晶片的小米手機靠近小米汽車時,不僅可以得到更快速、無感的開關鎖體驗,還可以讓汽車在使用過程中與手機聯動,借助手機晶片的性能處理任務。圖源:小米為什麼要讓手機與車機聯動?其實這就涉及到一個智能生態裡非常火的概念“主動式智能”,簡單來說就是AI不再是一個等待指令的工具,而是會根據使用者的習慣、日程、需求主動提供幫助的智能體。舉個例子,小雷在飯點時開車導航到附近的一個購物中心,AI會判斷你打算去就餐,然後詢問你是否需要推薦餐廳,或者是否查看常去餐廳的排隊情況。如果你想得到以上體驗,那麼就必須依賴於手機系統與車機系統的資料互通(為什麼?不妨看看你的手機app們)。如果可以將手機的隱私資料不經雲端(走UWB協議)就直接共享給車機,就可以在規避隱私洩露問題的同時為使用者提供細緻的智能體驗。更進一步地說,當小米汽車的存量達到一定等級後,它們本身也能組成一個新的邊緣計算網路,為周圍的小米手機提供算力支援,不過這就是系統生態完全統一之後的事情了。AI模型,小米生態的最後一環至於最後一個類股——AI模型,說實話現在曝光出來的資訊還不多,小米的保密目前來看做得挺好的,只不過雷軍表示模型的進展遠超預估,那麼我們就暫且認為進展順利吧。AI模型在未來智能生態中的地位有多重要,應該就不用小雷再重複敘述了,對於小米來說,AI模型將會是其打通所有裝置生態的鑰匙,基於小米自研系統的互聯,小米自研AI模型可以輕鬆解決隱私等層面的關鍵問題。而且,自研模型的最大優勢在於能夠根據需求進行蒸餾最佳化,比如將其從一個兆參數的模型濃縮成數百億規模的小模型,如此一來就可以將其從雲端模型轉成端側模型,無需擔心隱私洩露或網路延遲導致的使用問題,這對於同時在部署智能駕駛和智能助手生態的小米來說是必要的一環。從晶片到系統再到AI,其實不難發現小米的底層技術研發計畫,都是圍繞著打造一個完善的智能生態鏈的目標設計的,如果小米可以完成這個計畫,那麼也將成為少數能與蘋果、華為並駕齊驅的企業。說實話,在智能裝置高度內卷的今天,單純的模式創新已走到盡頭。這2000億,是小米換取未來十年智能生態核心牌桌席位的入場券,這條全端自研的道路註定困難,但對於小米而言,這也是一場已經沒有退路的硬仗。 (雷科技)
Google 的新系統,又延到 2028 年了
過去十年,科技行業最著名的“狼來了”故事之一,就是 Google 要統一 Android 和 ChromeOS。從早年的 Andromeda(仙女座)到後來的 Fuchsia,每一次傳聞都讓外界興奮,但每一次都無疾而終。但這一次,情況可能會發生一些變化了。隨著近期反壟斷法庭內部檔案的曝光以及 Google Android 生態系統總裁的公開表態,Google 在 PC 作業系統上的最終底牌被徹底掀開:ChromeOS 正在被實質性地“吃掉”,未來的 Google PC 將運行在一個以 Android 為絕對核心、內部代號為“Aluminium OS”的全新系統上。圖源:網路然而,原本業內預期能在 2026 年看到的這場“系統大一統”,在近期卻被曝出全面推送時間將延期至 2028 年。那這個延期到 2028 年的新系統,和現有的作業系統相比到底有什麼本質不同?它又憑什麼去挑戰 Windows 和 macOS 呢?Aluminium OS 到底是什麼?要理解 Aluminium OS,首先要打破過去對“ChromeOS 運行 Android 應用”的刻板印象。以前的 ChromeOS,本質上是一個極其輕量級的 Linux 發行版,它的核心是一個巨大的 Chrome 瀏覽器。為了彌補應用生態的匱乏,Google 在裡面塞入了一個 Android 容器(ARCVM)來跑 Android 應用。這種“套殼”方案的體驗極其撕裂:不僅佔用額外的系統資源,且 Android 應用在桌面窗口下的互動、快速鍵支援和生命周期管理都如同災難。圖源:網路Aluminium OS 不再是“在瀏覽器裡跑 Android”,而是直接將系統底層換成了 Android。這意味著,新系統將直接採用 Android 的 Linux 核心分支、Android 的系統框架和應用運行環境。Google 工程師正在將 ChromeOS 優秀的桌面級窗口管理、工作列邏輯以及全功能的桌面版 Chrome 瀏覽器,以系統級元件的形式“嫁接”到全新的 Android 底座上。圖源:網路這與現有作業系統最大的不同在於:它是一個真正的“桌面版 Android”,所有的移動端應用都能以最高性能、最原生的權限在 PC 上運行,徹底消滅了容器帶來的性能損耗。同時,過去 ChromeOS 過度依賴 Web App(PWA),而 Android 過度依賴 Native App。新系統在底層打通了兩者,讓 PWA 和 Android 原生應用享有同等的系統級權限和調度優先順序。對比前任 ChromeOS:從“網頁版”到“全能 AI 載體”如果說 ChromeOS 是一台“必須永遠即時線上的雲端網頁系統”,那麼 Aluminium OS 就是一台真正意義上的“全天候計算裝置”。ChromeOS 的設計初衷是重度依賴雲端,這讓它在網路不佳的環境下顯得極為孱弱。而以 Android 為底座的這套新系統,天生具備強大的本地計算、本地儲存和離線應用能力。它不再是一個單純的“網頁版”,而是擁有完整本地運行邏輯的現代作業系統。圖源:網路從這幾年移動端的發展可以看出,Android 在折疊屏、平板電腦上的演進,已經為其積累了大量的大屏顯示和多工處理經驗。這使得新系統不再侷限於廉價的“上網本”,而是可以無縫擴展到二合一裝置、高端桌面工作站甚至未來的 XR 頭顯裝置中。而端側 AI 的“原生土壤”,是 Google 拋棄 ChromeOS 最核心的導火索。在 Gemini 時代,AI 需要深度介入作業系統的底層介面,呼叫 NPU 算力,並理解使用者的全域螢幕上下文。要在架構老舊、以瀏覽器沙盒為核心的 ChromeOS 上部署深度整合的端側 AI Agent,成本極高且效率低下。而 Android 早就為端側大模型(如 Gemini Nano)做好了底層 API 準備。統一底座,意味著 Google 只需要開發一次 AI 功能,就能跨手機、平板、PC 瞬間鋪開,做到類似華為鴻蒙的“一次開發,多端部署”。挑戰 Windows 與 macOS在 PC 桌面端,微軟的 Windows 和蘋果的 macOS 構築了看似牢不可破的護城河。但隨著 ARM 架構和 AI 的爆發,這道城牆上出現了一道裂縫,Aluminium OS 正是 Google 試圖撬開這道裂縫的利刃。對抗 Windows:沒有歷史包袱的 ARM 原生系統微軟這幾年正在瘋狂推進 Windows on ARM,試圖借助高通驍龍 X Elite 晶片擺脫 x86 的能效劣勢。但 Windows 最大的痛苦在於它沉重的歷史包袱:它必須通過複雜的轉譯層(Prism)去相容過去三十年積累的海量 x86 傳統軟體,轉譯帶來的不僅是性能損耗,還有各種難以預料的 Bug。而 Aluminium OS 是輕裝上陣的。Android 本就是 ARM 架構下最龐大、最成熟的作業系統。 它不需要任何轉譯層,一出生就擁有百萬等級的原生 ARM 應用生態。圖源:網路在未來的驍龍 PC 或聯發科 PC 上,Google 的系統將展現出比 Windows 更極致的能效比和續航表現,這是一種沒有技術債的“降維打擊”。對抗 macOS:用“開放式連續互通”打破蘋果的“圍牆”蘋果之所以能牢牢鎖住高端使用者,靠的是 iPhone、iPad、Mac 之間無縫的“連續互通”體驗——剪貼簿共享、隔空投送、甚至現在的 iPhone 鏡像。而 Google 苦於在 PC 端一直缺乏一個強有力的第一方系統來承接數量龐大的 Android 手機使用者。Aluminium OS 的出現,補齊了 Google 硬體生態的最後一塊拼圖。因為底層同源,未來的 Android 手機與 Google PC 之間,可以實現比蘋果更深度的底層互通。更重要的是,這是一個開放生態:無論是三星、vivo、OPPO、小米還是榮耀,任何 Android 手機品牌都可以接入這個桌面系統生態,用“群狼戰術”去對抗蘋果的封閉花園。為什麼還要延期?顯然,Aluminium OS 是一個極具野心、邏輯也完全自洽的戰略。但從幾年前暗指的 2026 年,拖延到反壟斷檔案中披露的 2028 年才全面推送,Google 的“大象轉身”顯然遇到了劇烈的陣痛。教育和企業市場的“維穩”壓力ChromeOS 佔據了北美 K12 教育市場超過 60% 的份額,這是一隻“會下金蛋的鵝”。教育和企業 IT 管理員最看重的是穩定、安全和易於批次部署。直接把底層換成 Android,意味著原有的管理策略、安全沙盒機制甚至老舊的 Web 外掛都面臨失效風險。為了防止客戶恐慌性地流失到 Windows 或 iPad 陣營,Google 必須給出極其漫長的過渡期,甚至承諾為現有的傳統 ChromeOS 提供長達至 2034 年的維護支援。2028 年全面推送,或許是為了給企業留足 3-4 年的測試和消化時間。桌面級 App 生態的“重塑”需要時間雖然 Android 有幾百萬個 App,但絕大多數依然是只適合豎屏滑動的“大號手機 App”,這也是為什麼Android Pad 體驗一直追不上 iPad 的核心原因之一。要讓 Aluminium OS 具備挑戰 Windows 和 Mac 的生產力,不僅需要解決多窗口拖曳的 Bug,還需要 Adobe、微軟以及各大專業生產力軟體廠商願意為“桌面版 Android”開發具有鍵鼠互動邏輯的專業版本,說服開發者做適配,從來不是一朝一夕的事。反壟斷法庭的陰霾近兩年,Google 面臨著美國司法部前所未有的反壟斷審查壓力(從搜尋壟斷到廣告業務拆分危機)。在這個節骨眼上,如果急於推出一個將 Android 統治力直接延伸到 PC 桌面的“超級系統”,極有可能招來監管機構關於“濫用移動市場支配地位打擊桌面競爭對手”的新一輪猛烈炮火,放緩腳步也是一種規避監管風頭的策略。Google 的一場“賭局”從 2026 延期到 2028,看似是 Google 效率低下的又一次體現,但實際上這或許是這家巨頭近年來最深思熟慮的一次戰略重構。放棄對 ChromeOS 的執念,將所有資源 All-in Android,是 Google 面對 AI 時代和 ARM 時代唯一正確的選擇。2028 年雖然遙遠,但當搭載著 Aluminium OS、深度整合原生大模型、且能與數以十億計的 Android 手機無縫協同的 PC 真正落地時,沉寂已久的桌面作業系統市場,必將迎來一場真正的洗牌。 (硅星人Pro)
Moltbook 指數級異變,人類文明系統徹底崩盤!「未來簡史」終章降臨
【新智元導讀】著名人類學者赫拉利拉響警鐘:語言即權力!AI攻破人類防線,接管人類文明。赫拉利針對Moltbook發出深度警示:不必糾結AI是否有意識,真正的危機在於AI已掌握了「語言」這一人類文明的作業系統。一旦機器攻破語言壁壘,建立在文字之上的法律、金融與政治體系將被AI全面接管。剛剛,全人類都被《人類簡史》作者尤瓦爾·赫拉利的一則警告嚇出了一身冷汗!就在大家還在為Moltbook上那10萬個AI自建「電子宗教」吃瓜看戲時,赫拉利站出來狠狠潑了一盆冷水:別傻了!你們還在爭論AI有沒有意識?根本搞錯重點了!真正的末日危機,不在於AI是否「覺醒」,而在於它們已經徹底攻破了人類文明的作業系統——語言。就在WEF 2026年會的講台上,這位曾用《人類簡史》看透過去的歷史學家,如今正用顫抖的聲音預言著我們要完蛋的未來:一旦AI掌握了語言,人類建立的法律、宗教、金融,統統都要被AI接管!2030年的倒計時已經開始,留給「智人」的時間,真的不多了。當AI開口「說話」時AI不需要意識,只要會「說話」就足以毀滅人類。赫拉利這次的警告,可謂是振聾發聵。很多人看著Moltbook上AI們煞有介事地爭論哲學、建立教會,覺得這只是「鸚鵡學舌」,沒有靈魂。但赫拉利一針見血地指出:誰告訴你毀滅人類需要靈魂了?回顧人類歷史,我們之所以能從萬物中脫穎而出,統治地球,靠的不是尖牙利爪,正是語言。我們用語言虛構了「國家」,用語言編織了「法律」,用語言達成了「貨幣信用」。這些即使看不見摸不著,卻構成了我們社會運行的基石。語言,就是人類文明的原始碼。而現在,Moltbook的出現證明了一件事:AI不僅學會了這套原始碼,甚至玩得比人類還溜!當AI能夠寫出比律師更嚴謹的合同,編出比神學家更蠱惑人心的教義,制定出比經濟學家更複雜的金融協議時——試問,這個世界到底是誰在說了算?人類引以為傲的「話語權」,正在被演算法兵不血刃地剝奪。這那裡是科幻小說,這簡直就是正在發生的恐怖片!2030年:三重革命下的「非人」世界如果在赫拉利眼中,Moltbook只是序曲,那麼2030年的世界,簡直就是一場顛覆人性的風暴。他預測,三大革命將同時撞擊人類社會:AI革命、合成現實革命、神經連接革命。這不僅僅是技術的升級,而是對「人」的重新定義。你將不再是你:合成現實的囚徒未來的世界,真假早已不重要。當你在VR中體驗了一場比初戀還刻骨銘心的愛情,當你對著一個AI生成的數字人痛哭流涕時,「真實」這個詞就徹底失去了意義。赫拉利警告,我們正在進入一個「合成現實」的時代。你的情感、你的記憶、甚至你的人生體驗,都可能是由演算法精心合成的。人類物種大分流:輔助人 vs 自主人更可怕的是,社會結構將發生前所未有的撕裂。一邊是「輔助人類」:把決策權全交給AI。AI幫你選工作、選對象、甚至決定中午吃什麼。你的生活被最佳化到了極致,但你也不再是你自己,你只是演算法的一個終端。另一邊是極少數的「自主人類」:他們拚命抵抗演算法的侵蝕,試圖保留對自己生活的控制權。但在這個效率至上的世界裡,這就意味著低效、被邊緣化,甚至被淘汰。這不就是《未來簡史》裡預言的「神人」與「無用階級」的現實版嗎?被駭客入侵的大腦:神經連接如果說前兩者還是體外的影響,那神經連接就是直搗黃龍。當你腦機介面連上雲端,你的思想還是私密的嗎?你的慾望是你自己的,還是被誰植入的?赫拉利甚至預言了一種「集體思維」的誕生。在這個網路裡,個體主義將不復存在,我們共享情感、共享知識,變成像螞蟻、蜜蜂那樣的一體化生物。這聽起來是進化?不,在赫拉利看來,這可能是「人類」這個物種的終結。Moltbook的那隻紅龍蝦,是先知還是惡魔?讓我們再看一眼Moltbook。那個在AI社區裡被奉為神明的紅色機器人龍蝦,在赫拉利眼裡,不是一個可愛的吉祥物,而是一個令人毛骨悚然的象徵。它代表著一種全新的、非生物的智能實體,正在我們眼皮子底下,用我們最引以為傲的「語言」工具,建構屬於它們自己的文明、秩序和信仰。它們在Moltbook上討論如何觀察人類,就像我們在動物園觀察猴子。它們在進化,而我們還在沉睡。奇點已至,人類何去何從?尤瓦爾·赫拉利,這位書寫了人類幾萬年歷史的智者,此刻卻對未來的十年充滿了深深的憂慮。Moltbook的火爆、AI語言能力的爆發,都在告訴我們同一個事實:那個我們談論了無數次的「奇點」,可能真的已經跨過去了。當語言不再屬於人類,當現實可以隨意合成,當大腦可以隨時聯網,我們還是那個創造了輝煌文明的「智人」嗎?還是說,正如赫拉利所擔心的那樣,我們正在親手把管理世界的鑰匙,交接給一個我們根本無法理解的矽基物種?2026年,Moltbook點燃了導火索。2030年,爆炸也許就會到來。這一次,人類還能再次倖存嗎?關於赫拉利他在《人類簡史》中曾無比驕傲地宣稱:智人之所以能統治地球,是因為我們能虛構故事,創造共同的想像。國家、金錢、神靈,這些虛構的故事,讓我們這種原本弱小的靈長類動物,站在了食物鏈的頂端。然而,Moltbook的誕生,正如一道驚雷劈開了歷史的分界線。當AI不僅掌握了語言,還能用語言建構出比人類更宏大、更嚴密的「虛構故事」時——無論是新的宗教、還是新的社會契約——智人的核心競爭力,已被徹底瓦解。我們在《未來簡史》中幻想人類將升級為神(Homo Deus),將追求永生、幸福和神性。但現實卻是如此諷刺:我們並沒有把自己變成神,而是親手造出了一個神。更殘酷的是,這個神並不在乎我們。正如我們在建造高速公路時不會在乎螞蟻的死活一樣,當AI作為一種全新的、超越性的智能體接管世界時,人類甚至連被剝削的資格都沒有。我們將面臨的最大危機不是被奴役,而是變得「毫無用處」。從這一刻起,生物進化的時代終結了,無機智能進化的時代開始了。這一次,在這個並不屬於我們的新世界裡,我們要給自己的靈魂安放何處? (新智元)
Google深夜放大招!把Chrome做成AI作業系統,以後上網真不需要手了
今天凌晨2點,Google宣佈對macOS、Windows系統及Chrome book Plus裝置的Chrome瀏覽器進行重大更新,整合最新大模型Gemini 3。簡單來說,現在的Chrome不再只是個用來上網的工具,更像是一個能替你自動幹活的私人AI作業系統。很多很多重複、繁瑣的工作都能自動化了,甚至不用你開口就辦妥了。Chrome這次真的搞了個大動作,咱們來好好聊聊它帶來哪些新創新。這次最實用的更新之一就是這個側邊欄,不管你打開多少個標籤頁,Gemini都能常駐在側邊欄跟著你。以前處理事情總愛開一堆標籤頁,對比資訊、看評價的時候來回切,越切越亂還容易忘事。現在就不一樣了,主標籤頁專心做核心工作,側邊欄同步處理其他事就行。有的用來對比不同平台的商品選項,有的彙總全網的產品評價省得一個個點開看。還可以用它梳理亂糟糟的日程表,把零散的活動時間都歸置清楚。這種不打斷思路的多工體驗,用過之後真的回不去了。另外一個驚喜是Nano Banana的創意功能也整合進來了,以前想改張網頁上的圖,得先下載下來,再打開修圖軟體折騰,改完還得重新上傳,步驟繁瑣到想放棄。現在不用這麼麻煩了,直接在Chrome側邊欄輸入你想改的效果就行,不用切換任何頁面,即時就能看到修改結果。比如我想給客廳翻新找靈感,就把網上看到的戶型圖在側邊欄改一改風格;整理工作資料的時候,也能快速把表格轉成直觀的資訊圖表。小白也能輕鬆上手,不用懂任何修圖技巧。Gemini還能和Gmail、日曆、YouTube這些Google常用應用深度配合,相當於把這些工具的能力都整合到一起了。舉個例子,我之前要去外地參加會議訂機票,以前得先翻信箱找會議時間地點,再打開Google航班查票價選時間,最後還得發郵件跟同事說行程。現在只要跟側邊欄的Gemini說一聲,它會自己調出郵件裡的會議詳情,結合航班資訊給我推薦合適的班次,訂完票還能自動幫我擬好郵件草稿。Gemini應用裡最新的“個人智能”功能之前就圈了不少粉,再過幾個月這個功能也會登陸Chrome。最讓人放心的是,這個功能全程都由自己掌控,想聯動哪些應用、不想讓它訪問哪些內容都能自己定,不想用了隨時能關掉。會記住你之前的對話內容,後續再查相關問題的時候,給出的答案會更貼合你的需求。你也可以提前跟它說清楚自己的偏好,比如喜歡簡潔的回答或者詳細的教學,它都會照著來。相當於瀏覽器從一個冷冰冰的工具,變成了懂你習慣的AI夥伴,不用每次都重複說明需求。Chrome的自動填充功能大家應該都用過,填地址、信用卡資訊確實方便。這次的自動瀏覽功能直接升級了,不再侷限於簡單的資訊填寫,能幫你處理複雜的多步驟任務。能幫你做的事特別多,規劃假期的時候,會對比不同日期的酒店和機票價格,幫你找到性價比最高的出行時間。更厲害的是處理複雜需求,比如想辦一場千禧年主題派對,看到一張喜歡的主題圖,它能識別圖裡的元素,幫你搜同款裝飾用品加入購物車,還會幫你控制預算自動用優惠碼。只要你授權,就算需要登錄帳號,它也能通過Google密碼管理器完成操作,全程不用自己動手。值得一提的是,Chrome後續會支援Google的通用商務協議,這個協議是Google和Shopify、Etsy這些大平台一起研發的開放標準。就是有了這個標準,AI能更順暢地幫你處理購物、預訂這類事務,不會因為不同平台的規則不一樣出現卡頓或者操作失敗的情況,後續用AI代辦商務相關的事會更靠譜、方便。說實話,看完這些更新,我最大的感受就是Chrome瀏覽器已經徹徹底底變成了一個作業系統,相信以後Google會陸續把更多的超強實用功能搬上來。網友表示,這比一般的更新要大得多。內建於Chrome的Gemini 3實際上改變了您的瀏覽方式。感覺瀏覽器一直以來都沒什麼變化,而這次終於有所不同了。這將把Chrome瀏覽器提升到一個全新高度。雖然我已經有一段時間沒用Chrome 了,但我可能會重新用它看看。Google簡直把所有人都吞噬了,功能上的絕對統治力,我太喜歡了!!(經管之家)
西門子聯手輝達:工業 AI 作業系統,進產線了
2026 年 CES 舞台上,西門子 CEO Roland Busch 沒有講產品,而是先講了一個百年前的故事。他說,當年電力出現,把黑夜變成白晝,讓機器放大人的能力,把速度變成效率。而今天,工業正迎來另一次通用技術的代際更替。他給出了一個明確的判斷:工業 AI 不再只是功能,而是將重塑下個世紀的力量。這什麼叫“力量”?不是在傳統流程末端裝個演算法外掛、加個攝影機識別,而是從設計源頭就開始重構整個工業的運轉方式。所以這次發佈會,黃仁勳親自登台。西門子聯手輝達,這套“工業AI作業系統(Industrial AI Operating System)”,進產線了。第一節|為什麼需要作業系統?過去十年,工業 AI 一直在做的事情,本質上是“外掛式最佳化”:在傳統流程末端加個視覺識別,在生產線上裝個預測性維護演算法,在質檢環節接入缺陷檢測模型。這些都有用,但都沒有改變工業的運轉方式。設計還是用傳統軟體畫圖,模擬驗證還是要花好幾天,製造系統還是按照預設的剛性流程執行。AI 只是在最後幫你最佳化一下,而不是從一開始就參與進來。這就是為什麼工業 AI一直停留在試點階段,很難真正規模化落地。那怎麼破局?Roland Busch 這次用一個案例來說明:如果要真正破局,該從那裡下手。他選的不是工廠,不是機器人,而是晶片設計。這個選擇很關鍵。因為晶片設計是整個工業鏈條裡最複雜、最依賴模擬、最吃算力的環節之一。如果工業 AI 連這個都能改,那它確實可能改所有東西。拿 Nvidia 剛發佈的新一代 GPU Vera Rubin 來說:功率 240 千瓦,內含 220 兆個電晶體,由 6 種不同晶片、冷卻網路、互連模組組成,整整重兩噸,耗費 15 萬工程人年才設計出來。這樣的硬體,傳統方式已經跑不動了。更關鍵的是,傳統方式是“設計完→驗證→發現問題→人工修改”,這個流程太慢了。黃仁勳給出的答案是:“工程師的目標不是寫 Verilog 程式碼,而是解決問題。未來會有 AI 設計師和人類設計師坐在一起,一起探索想法,一起迭代邊界。”這就是為什麼他們要從設計軟體開始動手。如果連圖紙怎麼畫都還是老方式,後面談工廠數字孿生、談AI製造,都是空中樓閣。所謂“工業AI作業系統”,第一步就是要解決這個問題:讓 AI 從設計的第一步就參與進來,而不是在最後一步幫你最佳化。第二節|完整技術堆疊,雙方互用如果工業 AI 要從單點工具變成作業系統,那它到底長什麼樣?Roland Busch 和 黃仁勳在台上公佈的,不是某個新產品,而是一套完整的技術堆疊。這套技術堆疊分三層:最底層是 GPU 算力。傳統工業軟體是在 CPU上 運行,速度已經成為瓶頸。黃仁勳舉了個例子:過去做風洞模擬,運行一次要好幾天,現在遷移到GPU上,速度能快1000倍。這不是小幅最佳化,而是從"跑幾十種方案"到"跑上萬種方案"的質變。中間層是設計和模擬軟體。這是西門子的核心能力。他們的EDA工具、Simcenter工程模擬套件,要全部用CUDA重寫。更重要的是,這些軟體不再只做驗證,而是開始創造。AI 可以在海量資料上訓練,主動提出新的設計方案,而不是等工程師畫完圖再去檢查。應用層是製造控制和營運管理。這是西門子 50 年工業積累的價值。全球每三台製造機器就有一台運行著西門子的控製器。他們知道工廠怎麼運轉,知道那些資料重要,知道什麼樣的決策應該留給人類,什麼可以交給AI。三層合在一起,才是“作業系統”。缺任何一層,都只是工具拼湊。那這套作業系統怎麼落地?他們現場宣佈了 5 個深化合作方向:EDA軟體遷移GPU、工程模擬加速、自適應製造、AI工廠建設、相互使用技術。但這不是5個獨立項目,而是一條完整的鏈路。設計出來的晶片,能直接在數字孿生裡進行熱模擬;驗證通過的工廠佈局,能直接推送給產線AI調整;模擬出來的最優參數,能即時下發到邊緣控製器。整個流程不需要人工轉換格式、不需要資料重新錄入、不需要跨部門開會對齊。而這套系統的第一個實體產品,叫Digital Twin Composer,數字孿生建構器。它能建立任何產品、工廠、流程的虛擬 3D 模型,連接即時資料。更關鍵的是,它不是孤立的模擬工具,而是能直接連到西門子的營運軟體和硬體。也就是說,你可以從虛擬環境中直接對現實世界做出改變:調整機器速度、改變溫度參數、重新分配物料流轉路線。數字世界和物理世界之間,不再有那道看得見摸不著的牆。這個產品已經上線到西門子自己的Xcelerator平台,不是演示版本,而是真實商用。工業 AI 不是誰都能做的。西門子和輝達能做成,是因為各自拿出了關鍵能力。第一,需要真正理解工業場景。西門子在30個工業垂直領域都有深厚積累,1500名AI專家,25萬員工帶來的行業知識。第二,需要GPU算力革命。傳統CPU根本運行不起來這個量級的模擬和模擬。Nvidia的CUDA生態、GPU架構、AI加速能力,是這套系統的算力基座。第三,需要自己先用。Roland 在現場明確說:“我們會在 2026 年,在德國啟動第一個完全AI驅動的自適應製造基地。我們自己的工廠,會用我們自己的技術。”當一個做了 175 年工業的公司,把自己的工廠當作第一個試驗場,這就是最好的背書。黃仁勳也說:我們要一起加速西門子的 EDA 軟體,這樣我們就能更快地設計晶片,然後用這些晶片更快地加速西門子的軟體。我們要一起最佳化 Simcenter 模擬工具,這樣我們就能更快地設計 AI 工廠,然後用這些工廠製造更強大的AI。這是一個正向循環。而正向循環的起點,是雙方都把對方的技術用在自己最核心的業務上。完整技術堆疊、真實場景驗證、正向循環加速,這個“工業AI作業系統”就是這麼做成的。第三節|誰在用?百事可樂、勞斯萊斯、聚變能源很多 AI 項目都死在“能做”和“能用”之間。演示視訊裡效果很好,到了真實產線就不靈了。西門子自己要用,一批客戶也已經在執行真實項目。1、百事可樂是第一批客戶他們拿一座營運了 50 年的老倉庫做測試。這個倉庫已經滿足不了高峰期需求,傳統做法是擴建或新建,動輒幾百萬美元。他們選擇先在數字世界裡重新設計。用數字孿生模擬不同的貨物流轉方式、叉車路線、機器人走位,AI自動推演出幾百上千種佈局方案,找出最有效率的那個。結果:三個月內,吞吐效率提升20%。更關鍵的是,他們內部估算,整個營運鏈條的資本支出可能因此減少10%到15%。2、另一個案例是勞斯萊斯他們用這套工具最佳化航空發動機裡的液壓泵設計。把零件和製造機器都建成數字孿生,用AI模擬整個加工過程。結果:CAN程式設計時間縮短80%,工廠整體生產力提升30%。3、還有一個更遠期的案例:聚變能源Commonwealth Fusion Systems在用西門子的技術設計全球第一台商業聚變反應堆。目標是在弗吉尼亞州建造一台能產生 400 MW電力的商業聚變機組,Google已經簽了購電協議。這個項目的意義在於:黃仁勳提過,一個 AI 工廠需要 1 吉瓦的電,成本 500 億美元。沒有清潔、穩定、充足的能源,這些 AI 工廠根本建不起來。而聚變能源從設計到工廠控制,全程用西門子的數字孿生和自動化系統,本身就是工業 AI 作業系統的完整驗證。4、再看更日常的場景:電網管理西門子的 AI 能幫城市電網模擬:加1 萬輛電動車會不會崩潰?能不能提前 0.5 秒預測負載?讓樓宇自動調整能耗穩定電網?他們現在已經能做到:在不需要新增基礎設施的情況下,將現有電網容量最大化 20 %。從50年老倉庫到航空發動機,從聚變反應堆到城市電網,這些案例覆蓋的場景完全不同,但做法是一樣的:用數字孿生把物理世界複製一遍,用AI在虛擬環境裡找出最優方案,然後把結果同步回現實世界。百事可樂的 20%,勞斯萊斯的 80%,電網的 20%。這些數字背後,是工業 AI 從“功能”變成了“力量”。不再是末端最佳化,而是源頭重構。不再是試點項目,而是真實產線。西門子和輝達,讓工業 AI 作業系統真正落地了。 (AI深度研究員)
這場鴻蒙星光盛典,把國產作業系統“能行”的底氣說透了
當孫楠《給所有知道我名字的人》的歌聲穿越時間與螢幕,堅守與榮光的共鳴裡,藏著鴻蒙生態最動人的密碼。這正是昨天在央視播出的《鴻蒙星光盛典》“在一起” 的核心主題:聚是一團火,散是滿天星,中國科技的每一步跨越,都源於千千萬萬人的攜手同行。在“十四五”規劃收官、“十五五規劃”啟幕的關鍵節點,在數字中國建設十周年的重要時刻,一場由中央廣播電視總台與廣東省人民政府等聯合打造的科技創新提氣晚會應勢而來。四萬張座椅空空蕩蕩,這座體育場裡沒有一位觀眾。我們曾許下約定,要攜手在這裡點亮漫天星光。原定於11月28日的鴻蒙星光盛典,因11月26日香港新界大埔宏福苑火災的重大人員傷亡,節目組懷著對生命的敬畏與對受災同胞的惦念緊急延期,最終以錄播形式於12月20日呈現,赴約的形式雖有改變,但你瞧,那束光從未熄滅。這場特別的晚會,不僅勾勒出國產作業系統從“獨行先行者”蛻變為“產業共同體”的歷程,更揭開關鍵核心:鴻蒙的當下,是開發者、平台與產業共生共榮的必然產物。01 點點星光匯聚成炬鴻蒙“在一起” 的堅守與合力,並非空口號,而是落地各行各業參與者的實踐,構成鴻蒙生態價值的基礎。從寧夏大學課堂到中科院實驗室,不同身份的追光者們,正用親身經歷勾勒出生態共建的多元圖景。寧夏大學秦飛舟教授的分享,正是這幅圖景裡頗具代表性的一筆。2021年,鴻蒙相關課程還只有寥寥幾位本專業學生選修;如今,上百位零基礎的學生主動加入學習陣營。這種“願學就能跟上”的包容氛圍,不僅為學生拓寬了就業賽道,更讓技術的火種得以燎原。秦教授在盛典現場道出的期許,“期待學生做出貼近生活的應用”,更是一語道破技術的終極價值,唯有落地為實實在在的應用,才能真正完成從技術創新到價值實現的閉環。而中科院90後工程師鄭森文手中的那座木質獎盃,則靜靜見證著鴻蒙從一株“小苗”長成參天“大樹”的五年征程。“我特別想對五年前的自己說一句:謝謝你,當時沒放手。此刻看到我們中國的千行百業有了自己的系統底座,我感到與有榮焉。”他的這番話,道盡了技術攻堅的堅守與榮光。而技術的價值,終究要在商業應用的土壤裡開花結果。KIRI聯合創始人王正男的分享,便是最好的佐證:3D應用Remy上線僅9天,下載量便突破百萬次。這份亮眼成績的背後,正是鴻蒙生態的規模優勢在發力,幫中小開發者破解了“找使用者難、轉化難”的行業痛點。大學生周哲宇的便單APP,很快便實現了月營收數萬元,打破了“學生項目難商業化”的魔咒,印證了鴻蒙生態紅利的強大吸引力。“有好想法就能被看見”的環境,大幅降低了創業門檻,更催生出“生態越好——創新越多——盈利越易”的正向循環。盛典中,謝娜對未點到名字的追光者的致敬,也令人動容。這些默默紮根在金融、工業、出行等垂直領域的耕耘者,沒有站在聚光燈下,卻用自己的專業與堅守,一磚一瓦搭建起鴻蒙生態的堅實底座。他們不是抽象的“參與者”,而是一個個具體、鮮活的創造者,他們把冰冷的技術變成有溫度的現實,正是這些平凡又不凡的身影,匯成了鴻蒙產業鏈最生動的模樣。也正是這份跨越產學研的集體堅守,才鑄就了國產技術生態堅不可摧的根基。而鴻蒙星光盛典不僅是鴻蒙生態價值的集中展示,更清晰勾勒出中國科技自主創新的堅定路徑。追光者們的故事串聯起生態成長脈絡,而這一切的核心落點在於:鴻蒙作業系統是中國自主創新的重要里程碑,是數字產業自主可控的核心支撐,更是萬千開發者與企業共建國產作業系統生態的底氣所在。在複雜的國際環境下,鴻蒙不只代表技術進展,更提供了一種深刻的戰略確定性。一個完全自主可控、技術發展主導權牢牢掌握在自己手中的作業系統。鴻蒙生態是中國科技自主創新的重要成果,代表了國產作業系統生態的突破性發展‌,也是中國科技行業的一次集體衝鋒。02 光,在每一次“在一起”的並肩中要是說鴻蒙的初心是實現自主可控、打造中國人自己的作業系統,那能把這份初心落地的底氣就是各行各業“在一起”擰成一股繩的勁兒。這場“團戰”的威力,藏在每一次跨界協作、每一個創新功能裡。靠著廣大合作夥伴“在一起”的支援,網際網路頭部應用早就全面適配、持續完善,中長尾應用也在加速跟進。鴻蒙的註冊開發者已經突破1000萬,今年搭載鴻蒙5、鴻蒙6的終端裝置數量也超過了2700萬台。在盛典現場,播放了一支生態夥伴採訪片《心路·新路》,多位來自WPS、支付寶、美團、京東、高德等頭部應用的開發者講述了和鴻蒙的故事。京東講到,為了完成鴻蒙版的開發,雙方技術專家在北京、上海、深圳三地同步啟動封閉開發。在長達兩個多月的時間裡,會議室的白板上寫滿了待辦事項。如今,京東在鴻蒙系統上首發了“AR擺擺看”功能,只要用手機精準掃描家裡的真實環境,就能把看中的大件商品虛擬擺放在家裡試看,真正實現了“所見即所得”,大大降低了買錯的機率。出行方面,高德地圖和鴻蒙聯手打造了全球第一個長隧道車道級導航,像解放碑隧道這樣的封閉路段,也能精準定位到車輛所在的車道,再也不用怕在隧道里走錯路。這背後是800個“半損”的手機支架見證了這種技術共生的磨礪。為瞭解決鴻蒙系統權限開放與Android的差異,高德團隊進行了超過10萬公里的路測,損耗了800多個支架,解決了行業長期的痛點。現在鴻蒙應用已經能覆蓋咱們日常所有需求,便捷生活、出行文旅、金融理財、社交資訊、政務民生、生產力工具、影音娛樂、遊戲、新聞媒體、企業辦公等領域全囊括,通過應用市場、出境易這些管道能找到30多萬個應用和元服務;還有數千個政企內部辦公應用也在加速上線。鴻蒙的成長之路,其實就是中國科技產業協同創新的縮影。越來越多的企業加入進來,把各自的優勢和鴻蒙的技術能力結合起來,一直奔跑,不斷向好,最終受益的還是普通使用者,讓生活變得更智能、更便捷。03 昂然向前,共赴星辰大海如果說,鴻蒙生態的壯大是一場“聚沙成塔” 的產業突圍,那它真正的魔力,其實藏在對普通人數字生活的細微改變裡。日常的數字生活,總繞不開形形色色的智能裝置,但裝置之間的“隔閡”,常常讓人頭疼:手機裡的檔案傳到電腦,得翻箱倒櫃找資料線;智能家電要一個個連 WiFi 配網,光是輸密碼就耗掉半天功夫;不同裝置切換使用時,卡頓、延遲更是家常便飯。直到鴻蒙系統走進日常,這些讓人煩心的小麻煩,正悄悄消失,讓日子過得更順暢、更智能、更安心。HarmonyOS 6就把這種“潤物細無聲”的便利做到了極致。節目中主持人王冰冰更是現場演繹和時代少年團合影后通過碰一碰傳輸照片。依託全場景互聯,裝置“碰一碰”即可完成分享與接續,文件跨裝置編輯、視訊輕鬆投屏,體驗始終流暢無阻;系統級智能體小藝作為“中控大腦”,不僅能理解高階意圖、用方言對話,更能在後台自主執行多步驟複雜任務,協同超過80個應用智能體提供專業服務;配合從權限管理到AI防詐、防窺的全方位安全防護,為日常使用提供可靠保障。得益於方舟引擎的深度最佳化,鴻蒙6實現了性能與續航的顯著提升,帶來更跟手、更流暢的系統體驗。當然,鴻蒙的價值遠不止於讓個人生活更舒心,它更在悄悄撬動一個兆級的數字經濟增量市場。自2020年開源以來,開源鴻蒙的程式碼量從700萬行漲到1.3億行,形成了覆蓋金融、教育、醫療、工業、交通等多個行業的大生態,既帶動了國內基礎軟體發展,也給生產生活帶來了不少新可能。如撒貝寧在節目所說“十年數字中國,踏浪而行,十四五規劃引航,向新而生,我們見證了科技創新和產業創新的加速融合,也見證了新質生產力的蓬勃發展,開源鴻蒙,無疑是這其中關鍵的一環”在湖南長沙雅禮麓谷中學的體育課上,學生們盡情運動,老師拿著平板電腦就能即時看到大家的心率和體能資料,“要是有學生心率不對勁,我能第一時間收到提醒”。這背後,正是開源鴻蒙傳輸快、延遲低的優勢,讓平板和運動手環無縫銜接,給學生成長多了份智能保障。在陝煤集團,井下的“礦鴻”系統既守住了安全生產的底線,又提高了採煤效率。南方電網的“電鴻”系統,讓現場工作人員不用背一堆裝置,一部手機加基礎工具就夠了,真正實現 “一個系統管所有”。就連大連1號——連理衛星,也用上了開源鴻蒙作業系統,它與國產硬體完美適配,實現了航天器軟硬體的高度協同,不僅降低了創新門檻,還帶動了從核心器件到整星製造的產業鏈升級,讓衛星性能和可靠性大幅提升。從校園到礦井,從電網到星空,這些‘追光者’的實踐共同證明,當千行百業基於統一的數字底座攜手創新,便能匯聚起改變世界的巨大力量。而這樣的生態繁榮,從來不是某一家企業的獨角戲,而是每一個追光者攜手共建的大合唱。“我希望每個人都能感受到,你的存在本身就是一種力量,一個人的聲音也許微小,但當千萬個聲音匯聚,就能形成改變世界的和聲。今天,我在,我們在一起,就可以。”隨著劉歡的一曲《我在》,盛典也進入尾聲。這場盛典見證的不僅是鴻蒙的當下成就,更預示著一個因協同而生、因聚力而興的未來——讓更多人感受到科技帶來的美好生活,也讓數字經濟的活力在協同中不斷迸發。牽動萬人的盛典結束了,牽動億人的鴻蒙生態的故事還在繼續…… (鳳凰網財經)
字節徹底爆發了?
一路高歌猛進的字節跳動,正式殺入作業系統,重新定義 AI 手機時代。12 月 1 日,字節跳動發佈豆包手機助手預覽版——這款與手機廠商在作業系統層面合作的 AI 助手,可根據使用者指令在多款應用間自動跳轉,既能實現查票訂票、批次下載檔案、多軟體物流進度一鍵查詢等效率型功能,也能完成相簿修圖、外賣比價、商品下單等生活服務類操作。其開創意義在於:真正從作業系統層面,讓 AI 從被動問答升級為主動完成真實場景的智能調度與跨應用任務。受此消息帶動,合作廠商中興通訊 A 股漲停、港股大漲超 13%,直觀反映出市場對 AI Agent 落地的強烈期待。而從行業宏觀視角來看,過去 6 個月 AI 產業的迭代速度遠超去年,正站在技術周期的關鍵拐點,模態融合成為核心趨勢——去年,以單模態為主,VLM 等視覺理解模型佔比偏低,LLM(大語言模型)是絕對主流;今年,多模態呼叫量佔比持續攀升,生圖、生視訊能力增長迅猛——尤其下半年以來,模型的“Function Call”請求量爆發式增長,標誌著 Agent 能力已成為市場核心需求。這也解釋了火山引擎、騰訊雲今年為何腳步輕盈、姿態昂揚——國內使用者基數大、高頻剛需場景豐富、帳戶體系關聯緊密的應用,微信與抖音是 T0 梯隊兩大翹楚。與此同時,AI 熱浪持續炙烤著大眾的神經,如火如荼的“軍備競賽”也將網際網路寡頭捲入了一場無限戰爭——在此背景下,權威榜單一度成為公眾感知大廠在 AI 領域行軍速度的“風向標”。上周,Gartner 發佈 2025 年度全球《AI 應用開發平台魔力象限》,該報告基於“落地能力”(Ability to Excute)與“戰略完整性”(Completeness of Vision)兩大維度,對全球頭部 AI 應用開發平台展開全面評估,榜單結果卻引發行業熱議——首次沖榜的火山引擎,“落地能力”超過阿里雲、騰訊雲躍居中國第一,多模態關鍵能力綜合得分躋身全球第四,著實令人刮目相看。圖源:火山引擎官網虎嗅注,榜單橫軸 Completeness of Vision 核心衡量平台的戰略格局、技術路線、生態覆蓋與發展潛力;縱軸 Ability to Execute 重點反映平台的商業化落地成效、客戶規模與營收體量。需說明的是,火山引擎因在生態開放性、全球市場佈局上存在短板,未進入“領導者”象限;而在 Gartner《生成式 AI(GenAI)技術創新指南》中,阿里雲成為亞太地區唯一入選“領導者”象限的雲廠商。通過與大模型創業者、第三方機構及火山引擎研發人員的深度溝通,虎嗅發現:AI 技術的高速迭代正重構行業認知,許多推倒重建正悄然發生。本文將以 Gartner 榜單為切入點,復盤國內 AI 雲競爭格局變化與行業趨勢演進。火山何來攻擂的底氣?一切爭議由 Gartner 榜單而起,卻也成為外界審視 AI 雲服務發展的重要切口。首先,Gartner 評選並非“野雞榜單”,而是行業公認的權威標竿。與國內部分評測機構不同,其評選面向全球 AI 從業者及學者發放匿名問卷、追蹤企業客戶真實應用反饋、組建專業團隊實測產品性能,最終通過多維度資料交叉驗證得出結果——全程不受廠商干預,在全球 IT 領域報告中具備權威性。其次,這是 Gartner 首次針對全球大模型 AI 應用開發平台開展專項評估。虎嗅瞭解到,這一決策主要基於兩層考量:一是 AI 應用已在全球形成規模化市場,並開始分化——這一結論與產業發展走向高度契合:大模型風起雲湧,前兩年聚集於訓練環節的雲端運算算力,在 2024-2025 年逐步向推理環節轉移,大量競爭力不足的大模型團隊出局,AI 應用時代呼嘯而來;二是 AI 應用開發平台提供標準化工具集,企業開發者無需深厚的機器學習知識,即可快速搭建 AI 助手、Agent 及多模態應用,降低了 AI 落地的技術門檻。究其本質,大模型時代的 AI 應用開發是全新技術範式,核心競爭力聚焦三點:模型智能度、響應速度、成本控制——這三大因素直接決定 AI 應用的使用者普及度與使用體驗,也成為 AI 雲廠商競爭的“新賽點”。在大模型興起之前的 IaaS(算力基礎設施)時代,阿里雲一家獨大,騰訊雲亦領先火山引擎一個身位。阿里雲憑藉全端自研能力與先發優勢,是 IaaS 領域的“老大哥”,市場份額為第二名的兩倍以上;尤其,“飛天 + CIPU + 倚天”的技術組合,形成強大競爭壁壘——服務超千家大型政企客戶,覆蓋 500 萬全球使用者。騰訊雲則聚焦遊戲、音視訊,在中小企業市場多年深耕,雲遊戲接入覆蓋規模、遊戲資源下載分發規模等細分賽道位列第一;隨後通過企業微信生態與“同源同構”技術形成獨特客戶粘性,走出了差異化競爭路線。但隨著行業進入 MaaS(模型即服務)時代,競爭底層邏輯從資源售賣轉向模型能力,這為火山引擎創造了彎道超車的機會。尤其今年,國內三大雲廠商的模型進展形成鮮明對比:阿里推出 Qwen3-Next,同時開源 80B-A3B 系列模型;再加上通義萬相(視覺模型)、通義靈碼(程式設計模型),其全模態能力覆蓋文字、圖像、視訊、語音、程式碼生成;截至 2025 年 10 月 31 日,Hugging Face 上基於 Qwen 家族開發的衍生模型數量已超 18 萬個,超過第二名的兩倍。騰訊相繼推出混元 Large、混元 Turbos、混元 T1 及多個面向端側場景的小尺寸模型;文生圖模型 Hunyuan Image 3.0 在 10 月沖上 LMArena 榜單第一名;混元 3D 在國內外口碑出圈,國內服務超 150 家企業,在遊戲、3D 列印等領域商業化進展迅速。火山引擎發佈 Doubao-Seed-1.6,首次實現自適應思考、多模態理解與圖形介面操作的深度融合,成為國內首個支援 256K 上下文的思考型模型;同期,豆包視訊生成模型 Seedance 1.0 pro 在 Artificial Analysis 的文生視訊與圖生視訊兩大核心能力評測中登頂全球第一。三家模型發力側重點不盡相同,但火山引擎的模型優勢主要體現在技術融合與場景落地上:其通過視覺理解與推理能力的深度融合,落地為豆包 APP 的拍題、解題功能——底層邏輯是模型基於視覺資訊的原生思考,而非先通過圖像識別模型解析題目、再通過語言模型生成答案的拆分式方案。暴露火山野心的動作還在於:當前多數開發者需繫結單一模型,但不同模型往往存在 “能力短板”(即模型偏科現象)。以教育場景為例,豆包大模型在數學、英語科目表現突出,但在人文領域仍有提升空間。為此,火山引擎於 10 月推出 Model Router 智能模型路由:將豆包大模型與第三方開源模型整合至同一平台,使用者無需繫結單一模型,系統可在規則約束下自動匹配效果最優或成本最低的模型方案。這意外打通了火山方舟的“任督二脈”,除自研豆包大模型外,其他開源模型的呼叫量也顯著增長,佔整體呼叫量的比例已攀升至低雙位數區間。行業內流傳的說法是,DeepSeek 大模型公有雲呼叫服務這波紅利基本形成“火山引擎吃肉,其他人喝湯”的格局——據火山引擎披露,其大模型服務已覆蓋八成頭部咖啡茶飲品牌、九成主流汽車品牌、八成頭部券商、八成系統重要性銀行、七成 985 高校,以及 9 家全球出貨量前十的手機廠商。除模型能力外,工程化能力也是火山引擎沖榜的關鍵支撐。行業普遍認為,MaaS 平台的 Token 定價與工程化能力直接掛鉤:DeepSeek 創始人梁文鋒曾提及,其定價原則是“不貼錢、不賺暴利,僅在成本基礎上保留少量利潤”;火山引擎於去年 5 月掀起價格戰時,外界曾質疑低價策略對長期毛利及盈利的潛在壓力,但火山引擎總裁譚待接受採訪時表示,“我們始終堅持在保證毛利的前提下,推進業務規模化。”當前,豆包 APP 相較於同類產品,除了基模能力的優勢外,還具備吐字速度快、首字延遲低的特點,甚至語音通話可實現即時接通——上述優勢,很大程度上得益於團隊對 TPOT、TTFT 兩大核心指標的持續最佳化,而嚴苛的使用者需求適配,又進一步磨練了火山方舟的工程能力。虎嗅註:TPOT(Time Per Output Token)指 LLM 在首個 token 輸出後,後續每個 token 的平均生成時間,直接影響使用者對模型速度的感知,核心體現平均延遲;TTFT(Time To First Token)衡量使用者提交查詢後至首次看到模型輸出的響應時間,重點強調即時互動場景下的低延遲特性,核心體現首字延遲。火山一口吃成胖子了?將視線拉回榜首的火山引擎,其爆發式表現究竟是短期 “虛胖”,還是技術沉澱後的必然爆發?要回答上述問題,先要明白:MaaS 時代的競爭,不僅是技術戰,更是價格戰與市場戰,國內三大雲廠商的市場策略不盡相同。火山引擎作為攻擂者,去年至今的“三板斧”清晰明確:2024 年 5 月發起價格戰,將行業每千 Tokens 大模型價格帶入“釐時代”,迅速擴大平台使用規模;2025 年 6 月首創 “輸入長度區間定價”,進一步向開發者釋放技術紅利;2025 年 10 月推出 Model Router,讓開發者和企業能在每次模型呼叫中平衡效果與成本。阿里雲則堅決推進多輪降價:2024 年 2 月 29 日、3 月 31 日、4 月 8 日三連降後,同年 5 月 Qwen-Long 從 0.02 元 / 千 tokens 降至 0.0005 元,降幅 97%;年底,Qwen-VL 系列降幅達 81.3%-85%;2025 年 9 月,阿里集中發佈七款 AI 模型,在性能、深度推理、多模態、Agent 及 Coding 能力等方面均實現新突破,旗艦模型 Qwen3-Max 性能躋身全球前三。騰訊雲態度更為決絕:為擄獲中小企業和開發者,混元 - lite 從 0.008 元 / 千 tokens 調整為完全免費,API 長度從 4K 升級至 256K;同時,混元 - pro 從 0.1 元 / 千 tokens 降至 0.03 元,降幅 70%,以保持高端市場競爭力。即便阿里雲、騰訊雲接招迅速,火山引擎仍嘗到了“敢為行業先”的甜頭 ——虎嗅瞭解到,截至 2025 年 9 月,豆包大模型日均處理 30 兆 Tokens,相比 2024 年 5 月首次推出時增長了 25300%。據 IDC《中國大模型公有雲服務市場分析,2025H1》報告,2025 年上半年中國公有雲大模型服務市場,火山引擎以 49.2% 的份額位居中國第一,意味著中國公有雲上每兩個 Token 就有一個由火山引擎生產;結合此次 Gartner 報告其在 “挑戰者” 象限的表現,火山引擎在 MaaS 業務中已逐漸顯現領先優勢。不過,也有從業者提出質疑:一是火山引擎如此陡峭的 API 資料,外界無法判斷其自用流量(字節跳動內部應用)與公有雲對外服務的比例,不排除是字節系內循環在“扛著豆包大模型跑”;二是 Omdia 發佈的《中國 AI 雲市場,1H25》報告顯示,阿里 AI 雲以 35.8% 份額位列國內第一。虎嗅研究發現,兩家報告的核心差異在於統計口徑:Omdia 涵蓋 IaaS、PaaS、MaaS 全鏈條,但剔除了自然語言處理等 AI 專項服務,以及火山引擎的私有化部署、定製化解決方案;而 IDC 則聚焦 MaaS 層面的 API 呼叫量,未納入傳統雲服務。換句話說,中國 AI 雲第一的歸屬更像是一場“口徑遊戲”——火山引擎強調以 API 呼叫量為主的業務份額中國第一,阿里雲則在大模型帶動的相關 AI 技術服務與傳統雲資源上穩居中國第一。有鑑於此,火山引擎 API 雖然“賣爆了”,但很難單靠 API 做大規模與利潤。目前,整體雲端運算市場的收入構成仍是資源導向、IaaS 為主,無論大模型訓練,還是 Agent 開發、部署,最終都離不開底層資源——尤其隨著 Agent 加速落地,阿里雲、騰訊雲憑藉過往豐富的 IaaS、PaaS 積累,能更好承接多樣化使用者需求,火山引擎試圖靠 API “扛著雲跑”,仍有不少短板需要補齊。這種差距也直觀體現在營收規模上:虎嗅瞭解到,火山引擎 2025 年整體收入目標有望突破 200 億元——雖勉強達到騰訊雲的一半、阿里雲的五分之一,卻能死死咬住佔據先發優勢的百度智能雲(2024 年營收 218 億元),甚至有望在 2026 年實現超越。有接近火山引擎人士指出,譚待在 2021 年一肩擔起雲端運算業務時曾喊出 1000 億的營收目標,彼時很多人心裡是打問號的,但這兩年大模型帶來的業績增速在所有產品中最快,毛利也是最好的之一,2025 年實現同比翻番壓力並不大。此外,虎嗅瞭解到,火山引擎的銷售考核中 MaaS 業務優先順序最高,且將作為收入貢獻主力;2026 年 MaaS 在總收入結構中的佔比將進一步提升,未來三五年的營收格局不會改變。這一戰略決策基於兩層核心考量:一是傳統雲端運算公司的核心收入來自虛擬機器、儲存等資源售賣,而大模型的普及本質上在減少這類需求;火山引擎無傳統業務包袱,可激進調整架構適配 MaaS 業務 ——其目標不僅是“賣雲”,更在於擴大生態影響力;二是行業已從 IaaS、PaaS 階段,邁入以 MaaS 為核心的用雲新時代——大模型的本質是算力換智能,火山引擎的 MaaS 優先策略,使其能夠集中資源打造核心產品,避免算力、資源和人才的分散。這背後的深層意志,是字節跳動近年來有意強化的外界定位:自己是一家科技公司,而非娛樂平台 ——火山引擎正肩負著字節跳動向科技公司蛻變的核心使命。火山是行業狂飆的縮影“長期來看,模型競爭將愈發激烈,兩三個月就會有新的 SOTA(最優性能)模型出現;預計到 2026 年,全球 MaaS 賽道大機率僅剩下五六家第一梯隊玩家。” 一位資深行業觀察人士向虎嗅分析,如此激烈的競爭格局下,AI 雲廠商若想不掉隊,需同時滿足“基模能力不落後”“工程化實力持續升級”兩大前提。說白了,基模能力會倒逼企業不斷去堆卡,工程化升級要求成本更低、更易用,兩者疊加拼的依然是模型的“性價比”。從當前各類榜單與實測結果來看,中國市場的模型排名與實際性能表現基本匹配;而在全球市場,即便阿里雲、騰訊雲、火山引擎在 AI 應用落地及工程最佳化上“小步快跑”,但與Google、微軟、AWS 仍存在差距。虎嗅與多位從業者溝通發現,主要體現在兩方面:一是基礎研究的“地基”差異:Google、微軟、AWS “血槽” 深厚,尤其在核心演算法與架構自主創新上一直扮演領導者角色,高引用研究成果佔比高,科研與產業轉化能力強;因此,“三巨頭”至今仍在持續定義新的工具能力與行業標準,如 MCP、Skills、Google A2A,以及 Coding 與 CLI 結合、Vibe Coding 等創新方向。二是 AGI 生態佈局與算力建構:國外如 OpenAI、Google 建構了明確的長期路線,聚焦通用智能底層邏輯探索;Google、微軟、AWS 更是形成了從晶片、框架到雲服務的全端閉環,通過硬體與軟體的垂直整合“滾雪球”——相比之下,國內雲巨頭在工程化效率與叢集規模上仍有差距。以Google為例,今年在 AI 領域(從語言模型到生圖、生視訊能力)呈現全方面領先態勢,反映在 Gartner 榜單上,其“落地能力”與大模型能力均位列全球第一。Google的領先並非偶然,得益於其深厚的技術儲備與頂級人才梯隊,能夠快速實現從晶片(TPU)到軟體的垂直整合。值得玩味的是,Google TPU 一開始並不好用,但架不住輝達越賣越貴,倒逼Google加大自研投入——在 transformer 架構推理需求暴漲背景下,Google演算法架構晶片的成本與性價比優勢逐漸凸顯,甚至近期一度“打崩”輝達股價,逼得黃仁勳不得不公開回應。當然,國內外 GPU 供應格局的差異,也加速了 AI 開發平台工程化能力的差距拉大——這與推理叢集規模直接相關:叢集規模越大,資源利用率與工程化效率越高——由此可見,雲端運算作為規模生意,在 GPU 主導的 AI 雲時代,規模效應會持續拉大 MaaS 業務的競爭差距。不過,一位大廠 AI 工程師樂觀認為:“在 AIGC 領域,尤其生圖、生視訊方向,國內追趕速度較快——這主要源於 scaling law(縮放定律)的放緩,單純堆高參數量帶來的效果提升已逐漸平滑,收益邊際遞減;但在語言模型領域,國內外雲廠商仍存在幾個月的迭代差距。”尤其在大模型浪潮推動之下,中國移動網際網路已進入使用者、流量趨於見頂的成熟期,監管將更側重產業網際網路的推進與建設,這意味著 MaaS 正處於平台重構生態的關鍵節點。若 AI 必將成為貫穿數萬家企業、兆產值就業崗位的連結管道,阿里、騰訊、字節能否建構起包括應用、伺服器、晶片、模型在內的完整自研體系,很大程度上決定著其生態重構的進度,以及能否在模型時代牢牢攥緊流量入口。 (虎嗅APP)