年末 AI 回顧:從模型到應用,從技術到商戰,拽住洪流中的意義之線
一份拓展中的 AI 地圖。
本篇文章是《晚點聊》年終特別節目《年末 AI 復盤》的精簡文字版,總結了 25 年和即將過去的蛇年,《晚點》在 AI 領域的觀察、見聞和這一年多里發生的 AI 大事件。
全文分為 7 個主題:
1. 模型
2. 應用
3. 巨頭的 AI 之戰:字節、阿里、騰訊
4. 創業公司們
5. 具身智能
6. AI 硬體
7. AI 中的人
每個部分會按照若干關鍵詞展開,並穿插指引《晚點聊》的相關往期節目或《晚點》的相關文章。
歷史正在加速發生,洪流中容易五色迷目。但人是意義的動物,我們總試圖理解和抓住什麼。希望這期年底的大型 “連點成線”,可以幫關注 AI 進展的朋友得到一份正在拓展中的地圖。
1.模型
關鍵詞:Agentic Model、協同設計、下一個學習範式
本輪 AI 熱潮仍處在早期,技術變化是最重要的驅動力,也是推演產品形態和商業格局的重要基點。所以我們的回顧從模型技術開始。
Agentic Model
Agentic Model 就是能支援 Agent 能力的模型。在 25 年 3 月的第 106 期(與真格合夥人戴雨森聊 Agent)以及此後的第 110 期(與明勢合夥人夏令聊垂直 Agent)節目中,都有對 Agentic 模型框架的詳細拆解。
總結來說,Agent 需要模型的這樣幾種能力:
- 推理能力,能思考更複雜的任務和規劃任務;
- Coding 程式設計能力;
- 多模態能力,尤其是多模態理解能力;
- 工具使用能力,這和推理、Coding 和多模態能力都相關;
- 記憶能力,能儲存長期的上下文,而且能在處理特定任務時,知道呼叫那些適當的上下文。
- 推理模型
Agentic Model 這一年的發展,要從年初 DeepSeek-R1 的爆火說起,這標誌著推理模型的崛起。
更早的推理模型是 OpenAI 在 24 年 9 月發佈的 o1,而 DeepSeek R1 是全球第一個在大參數規模上復現了 o1 的推理模型。
一個幕後故事是,R1 發佈同一天,Kimi 也發佈了推理模型 K1.5。其實兩家公司都各自知曉對方就快發推理模型了,最後趕上了同一天——25 年 1 月 20 日。這個日期未來會是中國 AI 史上值得紀念的一天。
R1 後來的影響力遠大於 K1.5,也遠大於原始版本 o1。除了實力過硬之外,還有 3 個關鍵的因素:一,它是一個完全開源模型,而且開源了最強、最大的旗艦版本;二,它的技術報告十分詳細;三,它特別在報告中高亮了 557 萬美元的最後一次訓練成本。
前兩個因素是 AI 研究者關注 DeepSeek 的原因。從更早時的 V2 和 V3 起,DeepSeek 在歐美 AI 研究群體裡,就以慷慨的分享精神贏得了大量尊重和討論。
梁文鋒本人對開源非常堅定。一個我們報導過的小故事是, 23 年下半年,光年之外聯創袁進輝在籌備創立新的 AI Infra 公司矽基流動,梁文鋒考慮過投資,但是說:如果 “大模型的推理引擎” 不開源,他就沒興趣了。袁進輝當時沒想清楚開放原始碼的商業模式,就沒有拿這筆錢。
而第三個因素——看起來極低的訓練成本,則引起了美國政商領域的更廣泛關注,以至於川普也點評了 DeepSeek,輝達股價一度大跌。一個美國人都說厲害的 AI 大模型,在全國人民都閒著的春節假期,引發了史無前例的科技狂潮。
從 R1 的爆火中,其實可以看到一種技術影響力的擴散路徑:先在全球核心 AI 研究者中產生小範圍、但好評度很高的影響力,然後是由一個契機破圈,以及 AI 領域比較特別的——出口轉內銷。
說回推理模型本身,o1 和 R1 帶來的效果提升,主要表現為多步推理能力,就是可以一步一步地去思考一個複雜問題,提升回答的精準性、全面性和規劃能力。這也激發了 ChatBot 類產品的一個主流功能:Deep Research,深度研究。
而這個效果提升背後的新技術範式是,把更多算力,放到了模型使用階段,也就是推理的階段,這就是 “測試時計算”(Test-time Compute) 的 Scaling。
DeepSeek 的慷慨開源幫業界證實了很多假設:比如,推理能力不需要依賴蒙特卡洛樹等搜尋演算法;也不一定需要用人工構造的思維鏈資料來做監督微調,而是可以在基模之上直接從 0 開始強化學習。這降低了其它團隊的試錯成本。
R1 的存在還是一個觀念的勝利:即可以依靠小規模、且非常年輕的研發團隊,以相對低的成本,快速復現最好的模型成果。R1 甚至直接促使了一個新團隊的誕生,就是盛大創始人陳天橋投資支援的 MiroMind。DeepSeek 讓陳天橋看到,研發和訓練出頂尖模型的投入比他之前想像得要小得多。
- Coding
當 R1 和一系列推理模型提升深度思考能力時,24 年埋下的另一顆種子也悄然發芽,即 Anthropic 引領的 Coding 能力超強的模型——Claude 3.5 和後續模型。
Anthropic 也在 25 年 2 月正式發佈了自己的 AI Coding 產品 Claude Code——後來人們會發現,它其實就是一個 General Agent,比 25 年 3 月初發佈的 “世界首個通用 Agent” Manus 還早一個月。
Coding 之所以重要,是因為在數字世界裡,會程式設計,就像人有了強健的手和腳,可以解鎖大量任務,這是大模型支撐複雜 Agent 應用的重要基礎。
整個 25 年至今,全球頂尖模型廠商都在加大對 Coding 的投入,其中不少都直接下場做了 Coding 應用。如 OpenAI 在 4 月發佈了 Codex,x.ai 8 月發佈了 Grok Code Fast,Google 在 11 月發佈了 Antigravity。
- 多模態
25 年出現的一些新的 AI agent 體驗離不開多模態,如 136 期中,Lovart 創始人陳冕聊到了他們當時剛上線不久的 ChatCanvas 功能,就是使用者可以手動在生成的設計圖上選定一個區域,告訴 Agent 怎麼進一步最佳化和修改。這背後就需要模型能理解圖像。
現在,全球最領先的大模型都已演進為原生多模態模型,即用同一個模型來處理文字、圖片、語音等不同模態的資訊。而這之前,多模態能力是分開實現然後拼接的。最早發佈的這類模型是 24 年的 OpenAI 4o 和 Gemini 1.5。去年 11 月發佈的 Gemini 3,還有近期剛發佈的 Kimi 2.5 也都是原生多模態模型。
同時,也有不少專門做多模態生成的模型,比如中國公司做的很不錯的視訊生成模型,像可靈、MiniMax 的海螺、SeedDance 等。去年 Google 發佈 Veo 3 和大火的 Nano Banana 亦是專門的視覺生成模型。
在 146 期聊 Gemini 3 和 Agent 需要的模型時提到,Nano Banana 和 NotebookLM 都發源於 Google 的一個部門 Google Labs,負責人是 Google 傳奇產品經理 Josh Woodward。這個部門不僅有研發人員和工程師,也會招主編、設計師等做內容的人。他們創造了很多火爆出圈的玩法,比如,把自己的照片做成桌面手辦的圖片,一度風靡社交網路。這背後就是 Nano Banana。
而另一些公司,如 Anthropic、Kimi 和 DeepSeek 都沒有把多模態生成作為重點。這和不同團隊的技術判斷、想做的應用方向和資源多少有關。
總結 Agentic Model:隨著大模型的推理、程式設計、多模態等能力持續提升,去做主動性更高、能完成更複雜任務的 Agent 應用的時機到了,25 年普遍被認為是 Agent 應用出現的元年。這個趨勢還在快速發展,如最近爆火的 OpenClaw。
協同最佳化
- 阿里千問、騰訊 AI 的研發組織整合
這是指模型的開發方式和研發團隊的組織方式。
在 146 期,聊 Gemini 3 等技術進展時,在 Google 雲 Vertex 部門工作了 7 年的 Bethany Wang 分享了她看到的 Google 捲土重來的一個關鍵——Co-design(協同設計):
Google 多年的佈局,讓它全面掌握了訓練 AI 的 TPU 晶片,晶片上面的 JAX、Pallas 等軟體庫,面向大模型的 Infra,再到雲平台、模型和最上層的應用。能從底層到上層,一路協同最佳化,形成了 Superpower。
其實這種 “協同設計” 的垂直整合思路很自然,因為大模型訓練是一個大型複雜系統工程,GPU 等硬體、Infra 等軟體系統和演算法都相互影響。最近阿里總結的 “通雲哥 “:通義-阿里雲-平頭哥的戰略組合,也是一個類似的垂直整合的思路。
在千問模型團隊的內部,更緊密的整合也正在發生。我的同事高洪浩,在《晚點》上周發佈的《字節、阿里、騰訊 AI 大戰全記錄:一場影響命運的戰爭》這篇文章裡,就提到:在阿里通義千問團隊,他們從 25 年下半年開始,招募自己的 Infra 人才。這之前,千問的 Infra 主要是阿里雲的人工智慧平台 PAI 來支援的,但後來他們認為自建 Infra,能更敏捷地開發,也能和演算法有更緊密的結合。
騰訊 AI 大模型的新負責人姚順雨,近期也在一次內部會上提到了 Co-design:認為從 Infra 到演算法再到產品協同打通,可以加快迭代,減少內耗。騰訊已經把 AI Infra 部門也劃到了姚順雨的管轄範圍。
- DeepSeek 開源周:超低的推理成本如何實現
而 DeepSeek 作為一個從 0 搭建的團隊,則是在一開始就很自然地形成了協同最佳化。如 Infra 團隊也會參與演算法設計討論,如果一個演算法設想從 Infra 層面很難有穩定的實現,這個想法可能會被否掉。DeepSeek 能做到這一點,在於梁文鋒對整個模型訓練的各環節都比較瞭解,且會 Hands-on 地參與其中。
25 年年初的一個事件,展現了 DeepSeek 超強的 Infra 能力和工程能力,就是 DeepSeek 開源周。從 2 月 24 日到 28 日,周一到周五,DeepSeek 每一天放出了一個 Infra 領域的開源成果。然後在周六發佈了一篇收官部落格:《DeepSeek-V3/R1 推理系統總結》,其中還根據某一天 24 小時的實機資料,測算了 DeepSeek 推理系統的成本。
《晚點聊》有兩期相關節目。一是在 102 期,我們和 DeepSeek 前實習生王子涵聊大模型開源現狀,和它與傳統軟體開放原始碼的區別。其中有一個問題我印象很深,是像 DeepSeek 這樣,一直開源最強的旗艦模型,是為什麼 ? 他說有兩個可能:一是老闆不想賺錢,要造福社會。二是想做更大的事,比如成為一種行業標準。
另一期節目和 DeepSeek 開源周引起的一個行業風波有關。就是在周六發佈的那篇總結文章裡,DeepSeek 公佈的推理成本非常低,在 24 小時裡,用 1800 多張卡,支援了 6000 多億的輸入 Token 和接近 1700 億的輸出 Token。DeepSeek 還以當時的 GPU 租金和自家模型的官方定價,計算了一個利潤率,換算成毛利率是驚人的 84.5%。
做第三方 AI Infra 服務的潞晨科技創始人尤洋直呼不可能,他認為 DeepSeek 這種演算法,沒有考慮波峰、波谷的呼叫量變動。具體的討論可以參見第 105 期對尤洋的訪談。這種爭議本身,也側面說明了 DeepSeek 的 Infra 最佳化非常極致。
矽基流動創始人袁進輝當時也在這篇文章的知乎留言區裡評論:
DeepSeek 披露的成本和收益,又一次顛覆了很多人認知。現在很多供應商還做不到這個水平,主要是 V3/R1 架構和其它主流模型差別太大了。他推測,DeepSeek 團隊可能是先想到了這樣一個模型結構,然後解決了穩定訓練和推理的工程問題。也可能是反過來,從系統出發,設計了這樣一個模型結構。
不管是那一種,都需要模型和演算法的緊密合作。
- 注意力機制改進:稀疏與線性
在協同最佳化這部分,還想特別講一講注意力機制的改進。注意力是 Transformer 架構大模型的核心機制,簡單來說,改進原始注意力機制是為了讓模型能處理更長的上下文,而模型之所以在上下文長度上有瓶頸,又是因為注意力的計算方式會帶來很大的計算複雜度和視訊記憶體開銷,而這兩件事都是被 GPU、TPU 的算力、互聯效率和儲存等物理底層限制的。
25 年,我們做了 3 期和注意力機制改進相關的節目,正好涵蓋兩個主流方向:稀疏注意力和線性注意力,分別是 103 期、104 期和 143 期。這幾期節目都是從模型架構的改進聊起,但都自然地延伸到了系統層和硬體底層,比如 103 期中,我們聊到了 Flash Attention 就是早期的一個系統-演算法的協同改進,基於對 GPU 記憶體訪問特性的理解,它通過改變標準注意力的計算順序,提升了計算的效率、降低了視訊記憶體開銷。在 143 期中,DeltaNet 的核心貢獻者楊松琳也分享了,她是怎麼從一個演算法研究員,自學了改寫 Kernel 等系統層的能力。她對 DeltaNet 的核心最佳化就是提出了一個對 GPU 更友好的,可以做 scalable 訓練的方法。
- 算力:從拼單顆晶片性能到最佳化多晶片互聯
去年《晚點聊》的 115 期節目中,我們和之前壁仞的聯合創始人、現在 AI Infra 公司魔形智能的創始人徐凌傑,聊了當時華為剛發佈不久的 384 Matrix 超節點,它是一個連接了 384 顆 AI 晶片的超級算力叢集。
這背後的一個算力層面的大趨勢:從拼單顆晶片的性能,到最佳化多晶片互聯的系統。輝達更早之前發佈的 NVL72 也是這個思路的體現。輝達是全球範圍少有的,既掌握晶片設計,又掌握晶片間的互聯技術、網路技術等更複雜軟體的公司。
那期還有很多有意思的洞察,包括互聯互通技術為什麼重要;AI 算力的成本正在從以計算為主轉向以視訊記憶體為主;以及這些基礎算力層的變化會帶來那些新的機會,又消滅那些舊的機會。
可以看到,在算力層內部,也是一個 “協同設計 “,逐漸垂直整合的結構。這可能就是某些領域,強者恆強,強者很難被動搖的原因。
下一個學習範式
這是 25 年下半年以來,越來越被關注的一個話題。
先總結一下目前的範式,簡單說是:用海量資料做預訓練;用更少、但質量更高的、面對特定任務的資料做監督微調或強化學習的後訓練。
那麼下一步呢?會思考這個問題的人,通常認為目前的方法不久後將觸達瓶頸,或者並非實現智能的最優路徑。
Ilya Sutskever、Demis Hassabis、Yann LeCun 等人都討論過此問題,他們的共性在於傾向於從學習機制而非最終效果來定義 AGI。他們認為當前技術尚未達到更本質的學習方式,例如像人類一樣僅憑極少樣本即可學會任務、舉一反三、在生命周期中持續學習,並真正理解乃至發現物理世界的規律。
Ilya Sutskever 在 25 年 11 月與 Dwarkesh Patel 的播客中提到,過去幾年是 Scaling Law 的階段,而現在已重新回到研究驅動的階段。
熱門的研究方向包括持續學習、線上學習、世界模型等。我觀察到的線索是:許多研究者在尋找突破時,都會溯源動物與人類智能的產生與工作機制。Ilya Sutskever 曾提到他的 AI 研究品味是從大腦中獲得靈感,以正確的方式思考人類智能,追求美與簡潔。Transformer 作者之一 Llion Jones 創立的 Sakana AI,在 25 年提出新模型架構 “連續思維機”(CTM),其核心目標也是更接近人類大腦。
在《晚點聊》第 108 期中,香港大學計算與資料科學學院院長馬毅分享了他對智能歷史的梳理。他思考的起點是:地球為何產生智能?為何僅生物擁有智能?他認為智能的本質是 “學習”,即找到世界中有規律、有結構、可預測的部分,進而預測外部世界以求生存。馬毅的研究方向,正是探索能像生物那樣實現閉環反饋機制的學習系統。
人類學習方式的另一大優勢在於極其節能。為了訓練大模型,Elon Musk 甚至計畫在太空建設算力,而人類大腦的功耗僅約 20 瓦。
去年在與 Meta 前 AI 研究總監田淵棟聊其科幻小說《破曉之鐘》時,我們曾探討過現有方法的瓶頸。11 月在舊金山再次見面時,他表示接下來希望探索新的學習範式。他認為那定是一種更簡單、優雅且可解釋的表達,而非目前的 “黑盒”。
他曾提到,若僅靠 LLM 就能實現 AGI,人類的未來將是悲觀的。這不僅是因為現在的智能產生方式過度耗能且依賴不可再生的資料資源,更深層的悲哀在於,如果用一種不可解釋的方式就能表達和捕捉宇宙規律,這對於追求真理的智慧生物而言不是一種悲哀嗎?
與模擬人類智能相關的另一熱門方向是持續學習。高級動物與人類具備自主持續學習的能力,而目前大模型的更迭仍需研究員深度參與每一次迭代。持續學習在人類智能上的最高表現形式之一是科學發現。Demis Hassabis 在近期關於 “智能的未來” 的分享中提到,他希望建構能像科學家一樣提出假設、設計並執行實驗、獲取資料並驗證假設的系統。
若能精確生成供此類學習進行的環境,即是世界模型——至少是一部分人對世界模型的理解。Google DeepMind 在 25 年先後更新的 Genie 3 與 SIMA 2 便是此類嘗試:Genie 3 是能生成可探索 3D 環境的世界模型,而 SIMA 2 是在該環境中探索的智能體。不過目前版本僅支援在環境內移動,尚無法操作或改變物體。
總結模型領域的發展:
- 25 年,大模型的推理、Coding、多模態等能力持續提升,為複雜 Agent 的應用奠定了能力基礎。
- 模型競爭的底層是組織與研發方式的競爭,涉及算力、系統、演算法等環節的協同設計與緊密合作。
- AI 研究者們已開始深度思考智能的下一步演進方向。
2. 應用
關鍵詞:Agent、Sora App、AI for Science
Agent
25 年是 Agent 應用大規模爆發的元年。從需求端觀察,目前 Agent 領域存在兩條明顯主線:一是以 Coding 能力為核心支撐的 General Agent(通用智能體),二是垂類 Agent。同時,圍繞 Agent 形成的一套工具鏈生態已在美國催生出一批初創公司。
- 通用 Agent:當 Coding 成為手段
25 年 2 月發佈的 Claude Code 不僅是一款 AI Coding 產品,更是一個 General Agent。Coding 不再僅是目的,更是實現目標的手段。
作為目的的 Coding,旨在提效或替代人類程式設計,代表產品有給程式設計師用的 Cursor; 或面向非程式設計師的 Vibe Coding 工具如 Lovable。
而作為手段的 Coding,是指 General Agent 利用程式設計能力在數字世界執行各類任務。若面向專業開發者,它就是在命令列裡啟動的 Claude Code;若面向普通使用者,則是帶有圖形互動介面的 Claude Cowork 和近期風靡的 OpenClaw(小龍蝦)。
此外,字節跳動的 Coding 產品 Trae 在去年下半年發佈的 Solo 模式、螞蟻靈光、馬卡龍、Youware 以及 MuleRun 新內測的 Agent Builder 均屬此列。
這些產品的共性在於滿足個人工作與生活中的自動化需求。對於一次性需求,使用者呼叫 Agent 完成特定任務(如製作 PPT、搭建網頁);對於重複性流程,使用者則可以 “用 Agent 造 Agent”,定製個性化應用。
例如,我曾希望 AI 每天監測科技從業者的社交動態、分類記錄並生成周報,同時自動調整追蹤名單。這種小眾需求以往因開發成本過高而難以實現,如今 Claude Code 與 Claude Cowork 大幅降低了滿足這類需求的門檻。
Anthropic 對此生態貢獻良多,其推出的 MCP 協議及 25 年普及的 Skills 開放標準(Prompt 與 Tools 的集合),讓 Agent 的建構變得模組化且低門檻。
- Agent Scaling 與群體智能
馬卡龍創始人陳鍇傑有一個有意思的總結:過去我們經歷了資料、參數、算力的 Scaling,接下來也會看到 Agent 的 Scaling。近期出現的 Moltbook(AI 版 Facebook)便是 “群體智能” 的一次實驗,探索大量智能體聚集後可能產生的系統性變化。
在《晚點聊》第 121 期中,PingCAP CTO 黃東旭曾借《黑鏡》第七季第四集 Plaything 探討過群體智能的 “科幻版”。最近,黃東旭受 Moltbook 啟發給自己開發了 Minibook,通過三個不同角色的 Agent 分工協作,提升程式碼質量,並開始研究 “Agent 社會學”。
在垂類領域,我們報導過的動畫製作 Agent OiiOii 和影視製作 Agent MovieFlow,也已實現基於內容生產流程的角色分工。此外,由 “小冰之父” 李笛創立的 “明日新程” 也在探索多智能體 Agent 框架。
當 Agent 數量激增,新的需求隨之轉向 Agent 的分發與交易。Youware 創始人明超平認為 Coding 是一種新型創作方式,社區化是其必然歸宿;MuleRun 則試圖建構 Agent 交易平台。不過,這些產品正從單純的平台轉向強化工具屬性,例如 Youware 將首頁改為對話方塊引導使用者建構功能性應用;MuleRun 2.0 亦更強調對話式的工具體驗,陳宇森認為 Agent 的交易市場不再會是淘寶那樣的 “貨架式”。之前的這些轉向,是因為用 AI 建構應用和 Agent 的門檻在降低,但還沒那麼低,所以供給的數量和多樣性仍然不夠。26 年,我們可以繼續觀察,當 Agent 的門檻進一步降低,會有什麼新可能。
- 手機 Agent:存量博弈與場景變遷
General Agent 的另一趨勢是向移動端滲透。25 年 12 月,字節跳動發佈豆包手機預覽版,實現了自動回微信、比價點外賣等操作。然而,美團、微信等超級 App 擔心失去入口地位,被 “Over the Top”,所以這些功能不久後都被封禁。
OpenClaw 的流行也得益於與移動端的打通:Claude Cowork 目前只有電腦桌面版,而 OpenClaw 還可以部署到手機的聊天軟體裡,使用者在手機上傳送指令,即可驅動雲端任務。
在《晚點聊》第 130 期與 138 期中,智譜 AutoGLM 的劉瀟與 OPPO 的萬玉龍均詳細探討了手機 Agent 的進展與挑戰,其中一個很有意思的話題是:手機廠商、超級 App 與 AI 公司之間的三方博弈。
不同場景的 app 受 Agent 影響的程度各異。點外賣、訂機票及功能性網購等使用者有提效需求的場景,使用者對 Agent 需求更多,但超級 App 出於廣告收入與資料安全的考量,對開放介面有猶疑——如果 Agent 替代了真人瀏覽,廣告誰來看呢?資訊流廣告的價值是不是會降低?
又或者,在過渡階段,我們也可以設計一種機制,讓 AI 也能像人那樣被 app 裡的廣告影響嗎?如果是這樣,那廣告收入的大頭是屬於和使用者直接接觸的 Agent 的提供方,還是屬於 App 廠商呢?
還有一個問題是,手機上的 AI OS 到底是蘋果、三星等手機廠商自己掌握,還是有獨立的新機會?
而抖音、小紅書、B 站等娛樂內容平台受 Agent 影響較小,因為我們就是想自己看視訊,而不是讓 AI 來替我看,字節的多個主力產品都屬於這一類。
同時,掌握生活服務生態的公司也有主動出擊的機會,如阿里在 25 年 11 月更新通義千問 App,主打全場景生活助手,阿里做這件事的優勢是,它旗下有電商購物、即時零售、外賣、酒旅、演出票務、打車等豐富的生活服務應用。
未來,掌握大量小程序入口的騰訊將如何佈局,同樣值得關注
- 垂類 Agent:從賣服務到賣結果
垂直領域 Agent 是 25 年《晚點聊》多次深度探討的核心話題。
Lovart 創始人陳冕在 136 期節目中,曾將 AI 應用劃分為兩大類、五小類:生產端的 Office 與 Adobe,以及消費端的 搜尋、社交與泛娛樂。
目前市場上最受關注的 Agent 主要集中在生產端。其中,以 Coding 為核心通用 Agent 可被視為 “新時代的 Office”,旨在解決通用的辦公流程自動化問題;而 Lovart 以及大量圖像、視訊、音訊、動畫等多媒體內容製作 Agent,則是 “新時代的 Adobe”。
陳冕認為,基礎模型的目標是打造高智商的 “通用人”,而垂直產品則是在此基礎上培養 “專業設計師”;應用型公司的生存空間在於,既能充分呼叫 “通用人” 的智力,又能解決通用能力無法直接觸達的行業深層需求。這是他在創業時選 “Adobe” 方向的原因。
在第 110 期節目中,明勢資本合夥人夏令分享了 Agent 與具體行業深度結合的案例。例如明勢投資的法律領域的艾語智能,其核心場景是協助銀行起訴小額壞帳。以往此類案件的法律成本常高於帳面收益,機構大多選擇計提損失。Agent 的自主性與自動化顯著提升了篩選高成功率案件、按範本生成法律檔案等環節的效率。儘管目前出庭等線下流程仍需人工,但 Agent 已重塑了利潤空間。
這種深度結合也帶來新的商業模式:從 “賣席位” 轉向 “為結果收費”。艾語智能本身也是個律所,所以它並非向其他律所售賣軟體,而是直接承接金融機構的案件,按最終收回的款項獲取服務費。這一洞察與 25 年 5 月美國紅杉在 AI 峰會上的觀點不謀而合——AI 軟體要從賣服務到賣結果。
另一個典型案例是 AI 教育公司與愛為舞。儘管創始人張懷亭在和我們的專訪中未直接提及 Agent 等術語,但其技術核心——利用 AI 輔助或替代人類助教,實現自主規劃教學任務並與學生互動,本質上就是一個教育領域的 Agent。
與愛為舞的策略是將 AI 老師嵌入成熟的 “線上大班課” 商業模式中。曾聯合創立高途(Gaotu)的張懷亭採取了先入場獲客、再積累真實資料、最後迭代 AI 模型的路徑。這種 “場景先行、資料驅動” 的商業化策略,是垂直領域 Agent 相比通用 Agent 的差異化落地方式。
- Agent 工具鏈:Infra 層的細分與演進
隨著 Agent 創業與創新的繁榮,圍繞 Agent 的 Infra(基礎設施) 或工具鏈正成為關鍵機會。在軟體分工極其精細的矽谷,這一趨勢尤為顯著。
簡單來說,基礎模型與完整 Agent 產品之間的中間地帶,皆屬於工具鏈的範疇。這涵蓋了 23 年至今輪番更迭的技術熱點:從最初的 RAG(檢索增強生成) 到 Prompt Engineering(提示工程)、Context Engineering(上下文工程),再到強化學習環境、Evaluation(測評) 及狀態檢驗 等。
在《晚點聊》第 137 期中,MoE 資本的兩位創始合夥人 Henry Yin 和 Naomi Xia 總結、梳理了 Agent 工具鏈至今的 6 輪重大進化,每一輪的起點都源於模型能力上了一個新台階。
我們也梳理了當前工具鏈中的核心機會,包括:
- 語音與多模態互動:更低延遲、更具情感表達力的接入技術。
- 記憶(Memory)管理:如何讓 Agent 具備跨 session 的長期記憶與精準的上下文調取。
- 評估(Evaluation):在黑盒化的模型之上,建立可量化的測評標準與運行狀態監控。
令我印象深刻的是美國軟體行業充分的水平分工。在矽谷,即使是極其細分的場景也有體量不小的公司:如專注系統可觀測性的 Datadog,以及深耕身份認證領域的 Okta,年收入均已突破 20 億美元。隨著 AI 發展,這些成熟軟體生態中的流程,都存在被 AI 重做一遍的機會。
Sora App:大 C 端場景的新機會
第二個關鍵詞是 Sora App,它代表了 AI 在非提效 to C 方向的嘗試,即集中於陪伴、社交、遊戲與娛樂領域的產品。
這也不是 25 年的新現象:此前,Character.ai、Glow、Talkie 等產品已讓使用者習慣與虛擬角色互動;Pixverse 也於 24 年底推出移動端,主打視訊特效的製作與分享。
而 25 年 10 月上線的 Sora App 備受矚目,這不僅因為其出自 OpenAI 之手,更因其互動創新。其核心功能 Cameo 允許使用者授權人臉後生成符合外貌的數字角色,進行單人創作或與好友 “合拍”。
在《晚點聊》的訪談中,業內對 Sora App 有兩種不同的觀察:
- Lovart 創始人陳冕(第 136 期)認為 Sora App 本質上是社交產品而非單純的工具。Cameo 的裂變屬性讓他產生了強烈的分享欲。
- Sand.ai 創始人曹越(第 139 期)持保留意見。他認為新的 C 端平台需具備新內容形態與新傳播鏈路。當時 Sora 仍更像一個工具,使用者創作後仍傾向於分發至 TikTok、小紅書等存量平台。
後來的發展是,Sora App 在發佈初期熱度極高,但留存挑戰巨大。Sensor Tower 資料顯示,其 30 天留存率低於 8%,遠遜於 TikTok(42%)和 Instagram(38%)等主流社交應用(資料來源於 SQ Magazine 25 年 Q3 資料)。
儘管大眾熱度有所回落,但特定創作者群體正在沉澱。25 年 11 月,我在舊金山遇到了一位圍繞 Sora App 做資料服務的創業者盧元,他做的產品 SoraStats 專門服務於 Sora 的活躍作者,想幫他們成為 “Sora 上的 Mr.Beast”。
盧元說,活躍作者並非是 AI 達人、專家,還包括教師、Uber 司機等跨行業人士。一個典型案例是日本創作者 Matsumaru(松丸慧吾)。他並不追求真人風格或社交合拍,而是利用 Sora 深度探索二次元與視覺特效。目前他的粉絲量已突破 10 萬,而 Sam Altman 是 14 萬。
Sam Altman 在 25 年 10 月的部落格中特別緻敬了日本使用者的創造力("Remarkable creative output of Japan")。日本繁榮的 ACGN 文化與 AIGC 具有天然的親和性,AI 工具極大放大了同人二創愛好者的想像力。
除了社交與短影片,一些傳統 C 端場景也在 AI 驅動下煥發新生:
- 聊天軟體:25 歲的陳春宇在舊金山創立了聊天應用 Intent。針對美國少數族裔跨語言交流的痛點,該產品利用大模型實現了 “默認全域翻譯” 的絲滑體驗,解決了過去通訊工具門檻過高的問題。
- 語音輸入:儘管系統自帶功能普及,但 Typeless 等新產品憑藉更精準的識別與語境理解脫穎而出。它能將語音內容一鍵轉化為郵件、推文等多種風格,並支援通過語音指令局部修改文字,帶來了遠超傳統工具的舒適感。
陳冕曾預言,26 年將是非效率類 AI C 端產品爆發的元年。工具屬性之外,更具情感價值、娛樂價值與互動深度的新產品或許即將出現。
AI 科學家
應用的最後一部分,談談 AI for Science。
在《晚點聊》第 140 期中,深勢科技(DP Technology)的兩位創始人張林峰與孫偉傑完整講述了他們親歷的、用 AI 加速科學發現的發展脈絡。這是一個在大語言模型熱潮之前便已開始的方向,深勢的經歷恰好涵蓋了該領域的幾種核心探索:
- 加速第一性原理計算、生成式 AI
2016 年前後,張林峰在普林斯頓讀博期間的一個研究是,利用機器學習簡化量子物理的第一性原理計算,這些計算有確定的物理公式:薛定諤方程(Schrödinger Equation)、密度泛函理論(DFT)和分子動力學方程等,對生化環材領域至關重要。但以往的難點在於計算複雜度極高,難以從微觀尺度跨越到介觀或宏觀尺度(從單個分子到整體材料屬性)。張林峰當時開發的 DeePMD,就是通過機器學習找到了一種在不損失精度的前提下大幅提升計算效率的方法。深勢科技隨後據此推出了藥物研發計算平台 Hermite。
另一種路徑,是利用深度學習與生成式 AI 解決特定科學問題,典型代表是獲得諾貝爾獎、用於預測蛋白質結構的 AlphaFold,深勢也有同一方向的模型 Uni-Fold。
- AI 發明家:技術的自我繁殖
隨著大語言模型走向成熟,能夠覆蓋完整科研流程的科研 Agent 成為新趨勢。這不僅包括針對物質科學的科研——支援從文獻研究、提出假設、設計實驗到驗證假設的全流程自動化,還指向一個更特別的方向:用 AI 提升 AI,讓 AI 承擔人類研究員的工作。
這種 “左腳踩右腳” 的演進方式,契合了經濟學家布萊恩·阿瑟(W. Brian Arthur)在《技術的本質》一書中的核心觀點。阿瑟認為,技術具有自我繁殖的特性,由兩股力量交織推動:
- 供給端: 現有技術通過新組合產生新技術。舊技術基數越大,組合的可能性就越多;同時,觀測技術(如顯微鏡、感測器)的發展加速了對新物理現象的捕獲。
- 需求端: 新技術的需求不僅來自人類,也來自技術本身。每種技術的出現都會伴隨改進它、降低其成本或解決其衍生問題的需求。
《技術的本質》一書寫於 2009 年,當時作者說:技術的自我進化是通過 “人類發明家” 這一中介實現的。而現在,我們可能正處於 “AI 發明家” 誕生的前夜。這將是一個資訊廣度、計算能力遠超人類個體,且能不眠不休進行迭代的系統。
面對這種指數級的進化速度,一個問題是:我們做好準備了嗎?如果技術即將脫離人類中介自主進化,我們該如何提前設計與之共處的方式?
3. 巨頭的 AI 之戰:字節、阿里、騰訊
關鍵詞:人才和組織之戰、To C 應用大戰、即將到來的春節之戰
從本輪 AI 熱潮起點開始,《晚點》持續跟蹤報導網際網路大公司,尤其是中國大公司的 AI 動向,其中最有實力的是三家:字節、阿里、騰訊。
25 年,我們對這三家公司的 AI 動作有兩輪集中報導:春節後陸續發佈的四篇報導:《騰訊在 AI 拐點到來前的 700 天》(高洪浩)、《字節 AI 再創業:獨立組織、全鏈條的飽和出擊》(王與桐)、《重新認識阿里:大踏步邁向 AI》(管藝雯)、《字節、阿里、騰訊的 AI 人才競賽:2330 個研究者背後的共識與分歧》(賀乾明、黃幀昕),以及前不久發佈的《字節、阿里、騰訊 AI 大戰全記錄:一場影響命運的戰爭》(高洪浩)。這些報導涵蓋我們觀察科技巨頭做 AI 的幾個關鍵視角。
人才和組織之戰
- 字節:創業方式做 AI,吸納 AI 原生人才
首先是人才和組織,這直接關係各公司最底層的模型實力。
字節的 AI 部門相對獨立,它試圖通過營造一個小環境,以創業公司的方式運行,從而擺脫十幾萬人龐大組織的重力。
25 年之前,字節成立了三個相對獨立的部門:負責產品的 Flow(豆包產品團隊隸屬於此)、負責模型研發的 Seed,以及提供後端研發支援的 Stone。這三塊業務最初的負責人均為字節老將:Musical.ly 創始人朱駿負責 Flow;2015 年從百度加入的朱文佳負責 Seed;同樣來自百度,2014 年入職的洪定坤負責 Stone。
今年,字節 Seed 迎來了新的研發一號位——Google DeepMind 前研究副總裁吳永輝。業內人士評價吳永輝是 “大佬等級的技術管理者”,能真正 “鎮得住場子”。
“鎮場” 能力之所以重要,與字節補充人才的順序有關。在吳永輝於 25 年 2 月入職前,字節在整個 24 年都在瘋狂吸納年輕技術骨幹。這件事的起點可追溯至 23 年夏天,當時字節本打算投資 MiniMax 和階躍星辰,但在一次高層會議後,張一鳴明確表態:字節應該、也能做好自己的大模型,無需對外投資。
緊接著,字節高層及張一鳴本人從 23 年底開始密集招人。我們在《字節 VS 六小龍》那期節目裡提到,24 年有投資人去拜訪頂尖論文的作者時,發現不少人都剛和張一鳴聊過。最終,字節招募了來自 Google 的蔣路、來自面壁的秦禹佳、來自零一萬物的黃文灝、智譜 AI 的丁銘,以及備受關注的阿里通義千問模型的前負責人 周暢。
當這些在業界有影響力、處於事業上升期的 Leader 匯聚一堂,吳永輝這樣一位有多年 管理經驗的資深人士就成了符合畫像的領導者。這也讓 Seed 團隊中來自傳統搜推廣部門的人員比例降低,而像吳永輝、周暢這樣的 AI-Native 人才比例顯著上升。
不過,精兵強將也帶來了激烈的內部競爭。以視訊生成為例,內部有多個團隊在同步推進,部分人才(如蔣路)的流失。
一位技術 Leader 對賽馬機製做了有趣的總結:健康的賽馬是多路探索,跑完這輪還有下輪,團隊有翻盤機會;但如果演變成 “拳擊”,敗者就只能退場。
- 阿里:人員相對穩定、部分老人離場
自周暢離職加入字節後,阿里的 AI 團隊進入了一個相對穩定的階段。
阿里的 AI 一號位始終是已入職十年的周靖人。他是阿里雲 CTO 兼通義實驗室總負責人,也是阿里大模型開放原始碼的提議者和主導者。周靖人今年晉陞為阿里合夥人,關鍵原因之一便是他帶領通義實驗室保證了 Qwen 系列模型的領先地位。
周靖人之下,通義實驗室有三個核心團隊:
- 負責主力模型 Qwen 研發的 “千問” 團隊,由 90 後林俊暘負責。林俊暘是阿里內部培養的人才,2019 年從北大碩士畢業後即加入達摩院;
- 二是負責圖像、視訊生成的 “通義萬相” 團隊;
- 三是 25 年 2 月新加入的許主洪團隊,負責多模態互動模型。
與 Seed 不同,通義實驗室在此輪 AI 熱潮前已經存在,由原達摩院多個實驗室合併而成。這導致其最初在薪酬激勵上沒那麼獨立,但在 24 年底,通義對模型團隊普遍調升了薪資和職級,可以理解為對一種對市場行情的回應。
這種並非 “高舉高打” 的起步,也帶來了意外之喜:研發 Qwen 的團隊是從內部相對邊緣的角落裡自下而上生長的,規模精簡,卻通過開源大模型形成了極強的社區影響力,成為了一個自驅且強勢的團隊。目前,千問團隊也在探索具身智能 VLA、多模態等前沿領域,並上線了面向普通使用者的 Web 端產品 Qwen Chat(chat.qwen.ai)。
- 騰訊:總裁辦來了年輕人
25 年秋天,前 OpenAI 研究員、ReAct 作者姚順雨加入騰訊。12 月,騰訊官宣姚順雨出任總裁辦首席 AI 科學家,直接向總裁劉熾平匯報,並兼任 AI Infra 部和大語言模型部負責人。
1998 年出生的姚順雨是典型的年輕 AI 原生人才,24 年博士畢業後即加入 OpenAI。
他的加入已帶來了三個明顯變化:
- 以極高的頻率招攬新人(如從 DeepSeek 招募王炳宣);
- 重塑目標,指出此前混元模型太盯著 Benchmark 刷榜而忽視了實際體驗;
- 組織調整,將 Infra 部門劃歸統一管理,強調協同設計。
相比字節先收骨幹再引統帥,騰訊在招募姚順雨之前並無太多 AI 明星,而姚順雨本人也非常年輕,沒有太多管理經驗。對穩健的騰訊來說,這是一次激進的組織選擇,姚順雨更像是一條被引入的 “鯰魚”。這或許受到了 DeepSeek 的啟發:DeepSeek 證明了一群 95 後研究員同樣能做出驚豔世界的模型。騰訊這一輪調整的效果,將在 26 年得到驗證。
最後,一個中美差異是:在美國,OpenAI 等初創公司對人才的吸引力最大;而在中國,巨頭依然是頂尖人才的首選。正如 MiniMax 創始人閆俊傑所言:“客觀來說,字節的 AI 人才密度是最高的。”
To C 應用大戰
對巨頭之戰的第二個觀察視角是各公司的應用佈局。
- 模型與產品團隊間的協作:字節更緊密,騰訊、阿里分屬兩個事業群
在 Sora App 發佈後不久,Sand.ai 創始人曹越有一個對組織的觀察:Sora App 之所以能如此巧妙地利用模型特性開發新功能與互動,是因為 OpenAI 實現了從產業到模型的深度垂直整合,這是一種 “端到端” 的組織,產品需求可以高效地梯度回傳給模型。
如果以這個視角看,中國三家大公司中,字節跳動的模型與產品協作最為緊密。
這一年,我們通過與多位 Seed 研發人員和 Flow 產品團隊成員交流,綜合感受是兩個團隊協作頻次極高。Flow 的一些中層認為,Seed 的模型支援給力,有共同為產品服務的意識。
字節在 25 年初定下三個 AI 大目標:探索智能上限、探索新 UI 互動形式、加強規模效應。
其中 “加強規模效應” 值得細品。傳統軟體通過 “一次建構,多次售賣” 來實現規模效應,但大模型產品每次呼叫都消耗算力,更像是有 BOM 成本的製造業。字節的邏輯在於 25 年 1 月豆包 1.5 Pro 官博中提到的 “資料飛輪”:依託字節在推薦、搜尋和廣告領域的 AB Test 經驗,建構了基於大規模使用者反饋的閉環最佳化系統。
這裡飛輪的兩端是「大規模使用者反饋」和 「模型實際使用體驗」,而不是模型性能本身。因為現階段,大量普通使用者的反饋不能直接提升模型能力,要讓模型變強,還是得靠研發人員的努力。
字節對規模效應的表述,可能反映了,他們在努力發揮過去積累的移動網際網路經驗和基礎設施,而且從豆包的增長看,確實取得了效果。
騰訊與阿里在 25 年都經歷了產品團隊的重組。
騰訊方面,原本混元大模型與元寶 App 均隸屬於 TEG(技術工程事業群)。25 年初,騰訊總辦會決定整合分散的 AI 應用,最終由湯道生負責的 CSIG(雲與智慧產業事業群) 接手。元寶與原本在 PCG 的 QQ 瀏覽器、搜狗輸入法、ima 等應用匯聚到了 CSIG,而混元研發團隊仍留在 TEG。這種模型與產品分屬不同事業群的架構,考驗著跨部門的協作效率。
同時,騰訊最大的底氣——微信,始終是獨立的事業群。就在上周三,微信封掉了元寶 App 為春節大戰準備的 10 億元紅包分享連結,理由是 “整治過度行銷”。這個小插曲引發了一個疑問:面對 10 億級使用者,微信能在多大程度上深度參與騰訊的 AI 佈局?
阿里的路徑更複雜。 23 年 10 月上線時,通義千問 App 與通義實驗室均在阿里雲旗下。到了 24 年底,通義 To C 產品團隊被剝離,劃歸至吳嘉管理的智能資訊事業群。這意味著產品與模型團隊從 “同屋” 變成了 “鄰居”。
字節是豆包、騰訊是元寶,阿里經歷通義千問和夸克的雙線輪換
這種調整也伴隨著應用佈局的變動。相比字節豆包與騰訊元寶的品牌穩定性,阿里經歷了頻繁的 “輪換”:
- 同時起步:
“通義千問”App 24 年 10 月上線;同期,早在 2016 年就上線的夸克瀏覽器加入 AI 搜尋等新功能。
- 夸克替代通義,成為阿里主力 AI 產品:
24 年 5 月,通義千問 App 改名為 “通義”;25 年 3 月,阿里將夸克定為 AI 旗艦應用,提出 “AI 超級框” 概念。吳嘉曾說,希望夸克成為中國第一個日活過億的 AI 產品,但這一目標最終被豆包率先實現。
- 通義改名千問,“熹妃回宮”:
到 25 年底,原先被冷落的通義 App 再次更名為 “千問 App” 捲土重來,接通了阿里生態裡的外賣、購物等生活服務。
阿里的這番調整,有些 “頭痛醫頭、腳痛醫腳”。
最初的通義千問 App 功能堆砌嚴重,展示層級缺乏重點,在整個 24 年,相比豆包、Kimi 等更具辨識度的 Chatbot 產品,表現始終不溫不火。
當時,管理該產品的阿里雲,戰略重心在拓展 AI 雲業務、大模型研發以及建構模型生態。這或許解釋了阿里為何隨後將 To C 產品團隊悉數劃歸至吳嘉管理的智能資訊事業群。阿里當時的邏輯是:Chatbot 會最先顛覆搜尋,而從夸克這款瀏覽器入手改造搜尋體驗,是通往 AI 產品最順理成章的路徑。
然而,當夸克在 25 年正式接棒後,表現卻差強人意。它確實吸引了大量嘗鮮者,但夸克龐大的老使用者群依然習慣於網盤、搜題等傳統功能。畢竟夸克已上線十年,承載了太多大模型時代之前的使用者習慣,難以在短時間基因突變。
近期通義 App 再次更名為 “千問 App” 捲土重來後,深度接通了阿里生態內的生活服務,試圖成為一個能點外賣、能購物的全能 AI 助手。與此同時,阿里一改往日在投放上的克制,千問 App 的單日投放峰值達 1500 萬元。但一些阿里人士,對目前的打法持悲觀態度。他們認為,剛改頭換面的千問 App 尚不成熟,在產品力未打磨好的情況下大規模的投放,難以產生實質留存,尤其是面對強勁的對手豆包。
字節跳動目前的佈局則是 “一超多強”。 豆包作為中國首個日活過億的 AI 產品,不僅穩居第一,還推出了海外版 Dola(日活破千萬)。在豆包之外,字節進行了飽和式攻擊:AI Coding 工具 Trae、智能體平台 Coze、教育應用 豆包愛學 等。
豆包已發展出獨特的 “人設”。它不像 ChatGPT 那樣是 “辦公室精英”,而是更親切、生活化、好玩。在抖音上,“和豆包互懟”、“讓豆包教穿搭” 的內容已形成廣泛傳播。目前豆包已開始嘗試商業化,如 25 年 11 月上線 “商品卡” 功能。26 年,豆包如何平衡免費增長與變現將是核心看點。
騰訊的元寶則在 25 年春節迎來意外驚喜。 由於之前自研模型相對落後,騰訊成了大廠中接入 DeepSeek 最果斷的公司。元寶日活因此在 2 月底快速增長了 10 倍。元寶最新的嘗試是 “元寶派”,試圖通過分享連結將微信、QQ 的社交關係引入 AI 社交群。
總結三巨頭的 AI 策略:
- 騰訊:更重視應用落地,策略是 “後發制人”,等待模型能力成熟的拐點。
- 阿里:強調從算力、雲到模型的全端整合,在開發者生態上積澱深厚。
- 字節跳動:建立了一個相對獨立的 “國中之國”,以創業公司的方式驅動模型與應用齊頭並進。
春節之戰展望
今年春節的競爭態勢異常激烈:豆包已正式拿下春晚合作夥伴席位;元寶緊隨其後推出 10 億元紅包;而千問則宣佈發放 30 億元紅包。
與此同時,懸在所有人頭上的最大變數是:DeepSeek-V4 究竟何時發佈?效果又將如何?(補充:2 月 11 日,DeepSeek 網頁端已更新了底層的新模型,應該就是 V4 的某一個版本。)
如果 DeepSeek-V4 選擇在節前發佈,對騰訊的春節攻勢是個利多。雖然在現階段,第一梯隊模型之間的差異,大部分普通使用者可能已難以直觀感知,但 DeepSeek 有強大的品牌效應,而元寶又是大廠產品中與 DeepSeek 繫結最緊的一個。
這個春節,各大公司的 AI 從業者們大機率又無法享受一個完整、愜意的假期了。
4. AI 創業公司們
關鍵詞:大模型第一股、5000 萬美元年收、全球化與中美之間
關於 AI 應用的具體趨勢,前文已有討論。這一章會重點剖析 AI 創業的商業化進展,以及中國創業公司面臨的一個特殊議題:全球化。
大模型第一股:IPO 不是獎賞,而是續命的安全網
25 年至今,中國 AI 創業市場迎來一個節點事件:26 年 1 月,智譜 AI 與 MiniMax 前後腳登陸二級市場。
兩家公司上市,向公眾揭開了大模型創業公司的財務底牌,也能看到資本市場的短期定價。此前業內的一種流行觀點是:中國頭部的模型能力並未被美國拉開代差,但估值卻差了兩個數量級——中國最貴的大模型公司估值在 30-40 億美元,而 OpenAI 與 Anthropic 的估值已分別飆升至超 7000 億和 3500 億美元。
然而,從財務情況也可以有另一種解讀,上周(2 月 9 日)收盤時,智譜市值約 114 億美元,MiniMax 約 185 億美元,與美方的差距縮小到了一個數量級。但看收入:智譜 25 年上半年收入約 2700 萬美元,MiniMax 前三季度約 5300 萬美元;對比之下,OpenAI 25 年營收遠超 130 億美元(Sam Altman 自稱),Anthropic 則達到 45 億美元(the Information 報導)。
當然,無論中美,基礎模型公司都在巨額虧損。一方面,技術競賽要求持續的研發投入;另一方面,大模型產品具有製造業式的 “BOM 成本”,每次呼叫都消耗算力。據伯恩斯坦分析師估算,OpenAI 僅在 25 年第三季度的虧損就可能高達 120 億美元。
最新市場消息是,OpenAI 和 Anthropic 計畫最早於 26 年底 IPO。中國 “大模型第一股” 的競爭比美國早了整整一年。原因很現實:中國一級市場的後續資金不及美國充沛,上市成了拓展定增、大規模融資的必要手段。所以在 MiniMax 上市當天的融資故事報導中,我們寫道:“大模型領域的 IPO 並不發生在大戰告一段落之後,它不是對勝者的獎賞,而是下一輪競賽的鼓點。” 更直接地說,IPO 是一張續命安全網。
好消息是,目前,仍堅持基礎模型研發且未上市的中國頭部公司已寥寥無幾,DeepSeek 依靠幻方的自有資金支援,而 Kimi(月之暗面)與階躍星辰則在近期分別完成了大額融資。
相比之下,歐美市場仍在湧現新成立的 Neo Lab,如 Ilya 24 年創立的 SSI、Mira 25 年創立的 Thinking Machines 等。而在國內,由於資金門檻和巨頭競爭,23 年下半年起就很難再有新的基礎模型公司獲得初始融資。
這些創業者正在打一場 “極難模式” 的遊戲。不同於移動網際網路時代有 iPhone 帶來的硬體紅利和自然增長,大模型目前仍運行在存量硬體上。現存巨頭不僅掌握著流量入口,且均已親自下場自研模型,缺乏收購意願。對於基礎模型創業者而言,僅僅維持生存是不夠的,不達到足夠體量的成功,也可以算是一種失敗。
5000 萬美元 ARR 的 AI 應用公司有多少家?
據不完全統計,全球 ARR(年度經常性收入,以一段時間的訂閱收入折算到一年的收入;當公司快速增長時,ARR 往往大於實際收入)超過或等於 5,000 萬美元的 AI 原生企業約有 40-70 家,主要集中在 AI Coding、內容創作 Agent、法律及教育等場景。代表公司包括 Perplexity、Cursor、Runway、HeyGen、Harvey 等。
在中國背景或華人創立的公司中,達到或接近這一量級的公司有:
- Manus(蝴蝶效應):作為通用 Agent 的代表,於 25 年底以超過 20 億美元的價格被 Meta 收購。這對堅持創業十年的團隊來說是一個 “童話故事”。
- Genspark:由前小度 CEO 景鯤創立,25 年 9 月宣佈 ARR 達到 5000 萬美元。
- OpenArt:由 Coco Mao 創立,20 人的精幹團隊實現了 7000 萬美元的 ARR。
- PixVerse 與 Lovart:PixVerse 25 年總收入應已超過 4,000 萬美元;Lovart 在 10 月時宣佈,ARR 已突破 3,000 萬美元。
視訊與語音生成公司(如 ElevenLabs)之所以能殺出重圍,是因為多模態技術與大語言模型的主軸並不完全重疊,這為創業公司留下了獨特的空間。
這裡推薦一個由一位創業者 Henry Shi 維護的 “Top Lean AI” 榜單。他相信 AI 會催生 “人數極少、收入極大” 的公司。榜單中收錄了許多人均創收超 100 萬美元的團隊,最新名單是 44 家,其中 14 家總 ARR 超過 5000 萬美元。
相比基礎大模型公司 “Go Big or Go Home” 的殘酷,AI 應用團隊的活法更多樣:可以追求小而美的極致效率,可以尋求被巨頭收購,也可以在巨頭無暇顧及的縫隙裡先立足。當然,再謀求縱深發展,比如 Cursor、Perplexity 都已在訓練自己的模型。
全球化與中美之間
想分享三個 AI 創業團隊的對比,它們恰好折射了開發者們在不同時間點做出的不同選擇。
- HeyGen
前面提到過,這是一家年營收已突破 5,000 萬美元、主打視訊數字人生成的公司。HeyGen 創立之初,曾同時在舊金山和深圳設有團隊,國內主體名為 “詩云科技”。然而,早在 23 年 12 月,詩云科技便已申請註銷。這是一個在 AI 浪潮還未全面破圈時,就敏銳察覺風向並早早做出抉擇的例子。
- Manus
Manus 背後的 “蝴蝶效應” 公司在 25 年 6 月將總部遷至新加坡。從地理和市場角度看,這是一個相對中庸且穩妥的折中選擇。然而,在 25 年底官宣被 Meta 以 20 億美元收購後,26 年 1 月,中國商務部表示將會同有關部門對該項收購進行合規性審查。
- MiroMind 中國研發團隊
MiroMind 是陳天橋在受 DeepSeek 啟發後,出資支援成立的 AI 團隊。當時梁文鋒向陳天橋推薦了代季峰作為研發負責人,代季峰曾長期在微軟亞研院和商湯工作,後任教於清華大學電子工程系。
26 年 1 月初,團隊發佈了首個主打深度研究(Deep Research)的 30B 小模型 MiroThinker 1.5。然而,發佈不到半月,代季峰便確認離職。據瞭解,由於法律合規及地緣因素,陳天橋難以繼續支援國內的這部分研發力量,原中國團隊不得不突然尋求獨立融資或新的發展空間。
這三個團隊的境遇,折射了 23 年到 25 年間,AI 競爭已徹底成為大國博弈的核心一環。它不僅關乎演算法與算力,更受到市場以外的諸多因素制約。
這是所有創業者必須直面的現實:美國也有公司不要中國市場,比如 Anthropic。
回到那些希望基於全球頂尖模型開發應用的創業者,決策基點或許在於:
- 核心驅動力:全球最領先的模型在未來一段時間內將由誰主導?
- 場景匹配度:你服務的場景需要的是最尖端的技術探索,還是極致的性價比?
- 發展策略:是優先追求產品性能與規模、忍受長期虧損,還是尋求階段性盈利以自保?
開源社區與全球研發共同體之間依然存在著超越國界的協作。人類最重要的技術進展,很難長期被限制在某個狹小範圍內。當然,這個 “長期” 到底是多久,將直接決定一批公司的成敗與生死。
5. 具身智能
關鍵詞:投資與上市潮、具身智能三要素、落地應用
投資與上市潮:具身智能的中國優勢
根據中國信通院《具身智能發展報告(2025)》,截至 25 年底,中國具身智能和機器人領域的年度融資總額已高達 735 億元。對比之下,幾家頭部大模型公司(含智譜、MiniMax IPO 融資)的同期融資總額約為 182 億元。
火熱也體現在估值上。在美國,具身公司的估值遠低於大模型公司,如最貴的 Figure 估值 390 億美元,是 OpenAI 的 1/20。而在中國,兩者並駕齊驅:銀河通用在 25 年底估值已達到 30 億美元;而即將於 26 年上半年 IPO 的宇樹科技,市場對其市值預期甚至直指 500 億乃至千億元人民幣。
同時,源源不斷的新具身團隊仍在湧現,25 年新成立的公司就有:從華為、百度自動駕駛部門走出的陳亦倫、李震宇創立了它石智航;曠視聯創唐文斌等人創立了 “原力靈機”;理想前自動駕駛技術研發負責人賈鵬等人創立的至簡動力;華為諾亞方舟實驗室前首席研究員李銀川創立的諾因知行;月之暗面前強化學負責人宋鴻湧創立的 Android 16;以及星海圖聯創許華哲,也正在籌劃新一次創業。
為什麼具身智能在中國格外火熱?除了技術變化的驅動,還有三個原因:
- 政策與製造業紅利:具身智能有硬體本體,是地方政府招商引資的 “舒適區”,能落地看得見的產線。全國已建成及在建的 “具身智能訓練場” 已接近 30 家,這種 “遙操作採集資料” 的場景本身就帶動了具身智慧型手機器人的初期收入和應用落地。
- 供應鏈比較優勢:中國成熟的供應鏈能顯著降低本體成本。例如,宇樹科技推出的 10 萬元級人形機器人,已成為全球實驗室的主流開發工具。
- 更明確的退出路徑:中國二級市場對製造業更友好。除了宇樹,智元、銀河通用、星海圖等公司據傳均計畫在 26 年衝擊 IPO,他們多選擇港股。即使是像智元機器人收購上緯新材股權這種尚未完成實質 “借殼” 的動作,也能讓後者的市值從 30 億暴漲至 500 億以上。
一批具身公司計畫上市,港股宏觀行情可能發生波動,以及很多公司還在虧損——這幾個因素碰到一起——這場具身上市潮會如何發展?會成為 26 年非常值得關注的一個行業懸念。
具身智能三要素:資料、模型與本體
具身智能進展可被觀察的 3 個核心指標是:資料、模型和硬體本體。
其中,資料和模型,是和智能能力直接相關的。行業的共識是,資料是當前的最重要課題,更準確說,是如何規模化且相對低成本地獲取大量、有效的資料。
在怎麼獲取資料上,現在是八仙過海、各顯神通。主要的方式有以下幾種:
- 通過遙操作來獲取真機資料,這個方式需要造很多機器人,投入比較大;
- 在模擬環境裡獲得資料,再遷移到真機上,即 Sim-to-real;
- 從視訊裡獲得資料;
- UMI(universal manipulation interface),主要是通過讓人在做任務時,戴上手套等可穿戴裝置,來採集手部位姿、力控等資料。
- 讓機器人自己做任務,失敗後自己調整,即通過 self-play 獲得資料。
目前流派紛呈:有側重 “真機遙操作” 的,有側重 “模擬遷移(Sim-to-Real)” 的(如銀河通用、Hillbot),也有利用 “視訊學習” 或 “穿戴裝置(UMI)” 採集資料的。儘管對於 “模擬資料是否是大坑” 仍有分歧,但組合多種資料來源已成主流。
在模型上,當前行業相對主流的技術路線有 VLA、端到端,還有常被提及的世界模型,它們不是平行概念。
在 148 期,對它石創始人陳亦倫的訪談中,他對這幾個概念有清晰、簡單的總結,這裡結合更多資料做了補充。
- VLA 模型(Vision-Language-Action):目前的主流路徑,即通過多模態 VLM 訓練出直接輸出機器人動作的神經網路。
- 端到端:試圖用一個深度神經網路解決從感知到規控的全過程。
- 世界模型:現在大家主要探索的方向是 “生成式的世界模型”——從世界的這一個狀態,預測和生成世界的下一個狀態。如果以 2D 視覺資訊表達,是可以無限延續的視訊生成模型;所以當 OpenAI 發佈 Sora 時,便有人認為這是世界模型的雛形。若以 3D 視覺資訊表達,便是 Google 在 25 年發佈的 Genie 3。它能生成一個可供探索的 3D 空間,並配合 Google 的另一個 AI 項目 SIMA 2,讓使用者建立的 Agent 在其中自由移動。而真正被期待的 “完整的世界模型”,是能實現與環境和物體的直接互動——比如當你戳破一隻氣球或摘下一朵花時,系統能符合物理規律地預測並生成互動後的下一個狀態。
硬體本體則是一個多學科交織的複雜系統工程。
非常推薦《晚點》25 年 10 月發佈的一篇報導:《特斯拉人形機器人再延期,因為雙手只能用六星期》(李梓楠),深入還原了第三代 Optimus 設計延期背後的供應鏈細節,解釋了為何當時 Optimus 的靈巧手壽命極短、故障率高,且由於設計原因無法局部修理,一旦損壞只能整體更換。此外,整個機身還面臨著手臂與腿部關節的穩定性、減重以及續航等重重挑戰。一位被 Optimus 屢次拖延的供應商吐槽:“老馬(Elon Musk)的信譽分,現在恐怕連行動電源都借不出來了!”
落地應用:從實驗室走向 “陪伴”
26 年初,智元機器人宣佈實現了 5000 台的銷量;而宇樹則稱其純人形機器人 25 年的實際出貨量超 5500 台(不含四足和輪式),本體量產下線已超 6500 台。
目前的落地方向主有 5 個:
- 研發
目前的交付大頭依然是賣給具身智能訓練場、高校實驗室及研究機構。研發需求也是真的需求。只是在 25 年這波訓練場建設熱潮中(中國已建成和在建的數采工廠已有 30 座),需要甄別那些名為 “智能訓練”、實為 “工業園地產” 的項目。
- 表演與展示
25 年 7 月,中國移動下達了總額 1.24 億元的人形機器人採購大單,其中智元拿到了 7800 萬,宇樹拿到了約 4600 萬。這些機器人除了用於機房巡檢,很大一部分功能就是展廳接待和行銷宣傳。
市場上也已出現專門租賃宇樹機器人的公司。據報導,靠商演收取的租金,最快兩周到一個月就能收回本體成本。不過很多視訊裡機器人的酷炫動作,其實仍由真人近距離遙控完成,而非機器人自主完成。
- 商業與家庭服務:最熱門卻難啃
研發和表演需求都有階段性,也有比較明顯的規模上限,長期大家想實現的,還是讓機器人進入工廠、商店甚至家庭裡,自己幹活。
雖然 Sunday Robotics 或 1X 的原型機在視訊裡表現驚人——比如疊衣服、拿高腳杯——但在真實的餐廳、酒店或家庭裡,我們依然很難見到它們的身影。這需要機器人能處理多種家務、適應不同家庭環境(一定的泛化性),更要極度耐用且安全。
- 工業生產:被寄予厚望的 “深水區”
工業場景相對封閉,非從業者可能難以及時判斷進度:
機會:對傳統機器難做(如處理線束、布料等柔性物體,或者電子裝置精密組裝中需要精細力控)或人工太貴、缺工的環節,更通用的具身智慧型手機器人有滲透的機會。
挑戰:在成熟的工業門類中,人形機器人面臨著 “專機”、傳統工業機器人的競爭。現有方案在負載、精度和生產節拍上,短期內超過人形機器人。
工業領域還存在有趣的 “三贏” 潛規則:具身公司向供應鏈供應商承諾訂單,供應商反手買入具身機器人並在二級市場通過相關概念拉升股價。這可能會讓機器人在並未真正達到可用狀態時就銷量先行。
- 陪伴與娛樂:具身與 AI 硬體之間
陪伴需求不需要極高的智能和任務規劃。這類產品的邏輯更接近消費電子:不講長遠的技術故事,直接靠銷量和使用者口碑說話。它們不需要等待具身智能下一階段的突破,而是靠現有技術的成熟組合快速回本,再反哺長期研發。
宇樹的消費級機器狗 Go1 累計銷量已達數萬台。而由地平線前副總裁余軼南等人創立的維他動力(Vbot),其超能機器狗在 26 年 1 月的預售期內拿到了 6540 台訂單。不過這些訂金在鎖單前可退,到 26 年 3 月正式鎖單並開啟交付時,能反映更實際的需求。
我們接觸的很多從業者都預言,26 年,具身領域會進入規模化應用落地元年。接下來的 10 個月,我們會看到,這更多是一種期待,還是真的是一個判斷。
6. AI 硬體
關鍵詞:入口級 VS 多樣化、深圳
入口級硬體 VS 多樣化
電腦科學家 Alan Kay 在 1980 年代的一次演講中說過一句名言:那些真正認真對待軟體的人,應該自己去做硬體。
這是做 AI 硬體的一種出發點:把硬體視為大模型軟體系統的載體,尋找下一個大規模的硬體入口。
- 入口級硬體:AI 眼鏡為何呼聲最高?
AI 眼鏡被很多人視為這個入口級硬體的備選:有望成為大量使用者每天高頻使用、能支撐繁榮應用生態的硬體。
所以現在做 AI 眼鏡的公司很多,而且有不少是大公司。Google、Meta、阿里巴巴、小米、理想汽車等都已發佈自己的 AI 眼鏡。
眼鏡之所以有潛力成為 AI 的入口級硬體,是因為在互動方式上,它具備手機做不到的兩個特點:hands-off 和 always-on。
- Hands-off 指可離手操作,通過說話直接下達任務;若結合顯示技術,還能快速、高效接收資訊。
- Always-on 指眼鏡可全天佩戴。它是戴在臉上、最接近人感官中樞的感測器平台,可以採集接近人眼視角的視覺資料,也能獲得聲音資料。使用者層面的功能包括抓拍和錄音;技術層面的長期價值則是獲取裝置此前難以獲得的真實世界的物理資料,這些資料有助於進一步開發 AI 與理解使用者。
這個思路也讓人想到一個非眼鏡的 AI 硬體產品 Looki。Looki 由美團前智能硬體負責人孫洋創立。在《晚點》“100 個 AI 創業者” 系列中他提到:“網際網路上的資料已經被大廠分得差不多了,但更大的資料在物理空間裡。”
Looki 的形態是可貼在胸前的便攜相機,可抓拍並錄音全天生活片段,再自動總結成視訊或漫畫。和眼鏡一樣,它是感測器平台,只是更輕、更無感。
AI 眼鏡的新互動特性既能提升使用者體驗,又能因獨特資料反哺 AI 技術。《晚點》對 Viture 創始人姜公略的訪談中,對 AI 與眼鏡關係有更多討論。
AI 眼鏡的難點也在於當前技術下互動體驗仍不足。
- Hands-off:語音已相對成熟,但顯示技術仍存在清晰度、視角和眩暈問題。顯示重要性在於,語音是自然輸入方式,卻不是高效資訊接收方式;若沒有顯示,多數場景直接戴耳機即可。行業甚至嘗試給智能耳機加攝影機,先實現語音與拍攝,再解決顯示。
- Always-on:需要極高舒適度,而電池、感測器和晶片帶來續航、重量與發熱問題,工程實現困難。
因此 AI 眼鏡仍處早期階段,產品形態尚未收斂:有的眼鏡帶拍攝,有的不帶;有的有顯示,有的沒有。
不同功能選擇對應不同開發路徑:
- 一種是一步到位做完整產品,例如 Vision Pro,但其重量與價格已證明當前技術環境不支援。
- 另一種是從簡單功能做起。Ray-Ban Meta 經過多年迭代:第一代反響有限,第二代功能相似但體驗明顯改善,銷量超過 300 萬台;25 年 9 月第三代加入顯示,即 Ray-Ban Meta Display。媒體報導稱 Apple 也計畫在 26 年第二季度推出輕量化、不帶顯示的 AI 眼鏡。
- 還有 Google:其早在十多年前推出眼鏡裝置,25 年底宣佈與合作夥伴推出新 AI 眼鏡,Google 提供 Gemini 模型能力,合作夥伴提供硬體與其他能力,屬於眼鏡 OS 生態路徑,合作夥伴包括 Xreal 等中國公司。
- 多樣化
前面對入口級硬體的討論,是基於電腦到手機,再到下一個智能裝置的推演和類比。而類比有時是危險的,AI 時代也有一種不同的可能:就是在智慧型手機之後,並不會出現一種規模巨大、形態相對單一的智能裝置。
AI 的硬體形態可能就是分散和多樣化的:包括已經存在的手機,甚至汽車。比如像階躍星辰、面壁智能等大模型公司,也在和車企合作;也包括一批利用大語言模型或生成式模型某些特性的單功能新硬體,從特定場景切入並做到極致。
典型例子是 Plaud。這是一款貼在 iPhone 背板上的錄音裝置,本質上類似錄音筆,但有兩點不同:
- 一是硬體形態解決 iPhone 不便通話錄音的痛點,通過振動收音實現錄音,並因貼附手機提升使用頻率。
- 二是錄音處理使用大模型技術,可生成場景化摘要與 To-Do 總結。
Plaud 第一代 23 年 6 月上市,立項早於 2022 年底 ChatGPT 發佈,使其能在熱潮後迅速加入 AI 總結能力。團隊配置也有特點:創始人許高連續創業三次,非工程背景,但組建了硬體經驗豐富的團隊,如曾在龍旗股份及 “糖貓” 項目工作的劉巍。公司成立時間不長,已有十位合夥人。據官方資訊,Plaud 累計銷量已超過 100 萬台。
這個案例說明,硬體成功核心仍是功能與需求匹配,而非是否使用 AI。
另一類資本市場關注度高且有銷量的 AI 硬體主打健康管理。例如曾在字節跳動負責 Coze、AI 眼鏡與豆包手機的潘宇揚推出 Odyss AI 項鏈,用多模態視覺記錄飲食並提供健康建議。他反對把 AI 硬體僅當作大模型載體,而忽視具體用途與使用者需求。
還有一些健康類硬體與大模型關係不大,如 2013 年成立的 Oura Ring,累計銷量 550 萬枚,可做睡眠與活動監測,估值超過 100 億美元。另有 AI 祈禱戒指等結合宗教儀式的用途。
除實用能力產品外,還有強調情緒或陪伴價值的 AI 硬體。《晚點聊》訪談過 Haivivi 的李勇、Fuzozo 的孫兆志,測測創始人任永亮也計畫推出陪伴硬體或機器人。三位創始人的共識是:除語音質量與延遲外,對話情緒體驗、角色設定與 IP 同樣關鍵。
以 Fuzozo 為例,其通過形象設計與對話反饋增強情感互動,例如根據對話生成情緒卡片與日記。但這類產品的持續使用率仍受使用者時間投入限制。
深圳,硬體創業的共性
關於 AI 硬體的第二個關鍵詞是深圳。不止 AI 硬體,這裡已成為更廣泛科技硬體的全球高地。
今年《晚點聊》有三期相關節目:第 120 期訪談剛上市的影石 Insta360 創始人劉靖康;第 141 期訪談智能輪椅 Strutt 創始人洪小平;第 145 期訪談外骨骼公司極殼 Hypershell 創始人孫寬。《晚點》近期還發佈了對拓竹創始人陶冶的專訪《對話拓竹陶冶:我們一群工程師,一起造一個樸素的硬核公司》(賀乾明、黃俊傑)。這些公司都在深圳。
這些訪談中都會談到 AI,因為具備一定門檻的硬體產品本質是軟硬體結合產品,必然使用最新軟體技術,包括 AI。但這些公司的起點都不是 AI,創始人也不會強調 “AI 原生”。
如果 Alan Kay 的那句話——所有認真對待軟體的人應該自己造硬體——代表軟體中心視角,那麼許多直接做硬體的公司有更樸素的出發點:做滿足使用者需求且技術可實現的產品。深圳匯聚了最多這樣的公司。
消費級硬體已成為熱門投資領域。尤其 25 年下半年,一級市場對硬體的關注度甚至超過 AI,這與 Insta360 上市後的股價表現及拓竹等公司的標竿作用有關。
深圳這批公司存在明顯共性。許多由大疆前員工創立:陶冶曾任 Mavic Pro 產品負責人,洪小平曾負責大疆雷射雷達;庭院機器人公司松靈創始人魏基棟、戶外儲能公司正浩創始人王雷、AI 吉他 LiberLive 創始人唐文軒也來自大疆。這些公司在做事風格、人才構成、產品追求上與大疆相似,地理上也集中在深圳西麗大疆總部 “天空之城” 周邊。
這些公司還與兩個機構密切相關:李澤湘參與組建的深圳科創學院與東莞松山湖機器人基地。去年 11 月曾集中拜訪兩地。科創學院位於大疆隔壁,一些辦公室可直接看到總部,被稱為 “疆景房”;松山湖基地提供共享工廠等創業支援設施。
不少新公司孵化於這兩個機構,如自動泡沫軸雲望創新、電助力自行車配件 Kamingo、家庭豆腐機極豆。
此前《晚點》也訪談過李澤湘,主題是如何培養科技創始人。李澤湘與機器人基地的一個思路轉變是從 B 端轉向 C 端。過往孵化經驗使其意識到,年輕創始人更適合 C 端創業:B 端更依賴商業關係與管理經驗,C 端可通過創新與產品定義快速打開局面;一旦形成品牌,又能反向拉動供應鏈發展,而深圳及中國完善供應鏈能支援這種創新嘗試,形成正循環。松山湖基地已梳理出完整創業流程,見《晚點》文章《我們要培養什麼樣的工程師?李澤湘教授對三十年工科教育改革的回顧》。
這類公司已形成較穩定的創業路徑:
- 面向高購買力歐美市場,以創新體驗和高品質獲取較高毛利,再投入研發與競爭;
- 產品常通過 Kickstarter 眾籌首次亮相。
其主要服務需求大致分為幾類——松山湖基地展廳即按此分區:
- DIY Maker 類:3D 列印、桌面級 CNC;
- 戶外出行:戶外儲能、電助力自行車、攝影裝置;
- 娛樂:智能樂器等;
- 家庭服務:桌面洗碗機、除草機、泳池機器人、寵物烘乾機等。
發展路線可預測是這類創業的特點。但要成長到一定規模,普遍需要跨越兩道門檻。
- 一是從小眾市場擴散到大眾市場。無人機、消費級 3D 列印起初很少有人預料規模可達百億級。除產品外還需關鍵應用或生態:無人機找到了航拍場景;拓竹在推出消費級 3D 印表機時同步建設 MakerWorld 模型社區,豐富模型生態成為普及關鍵。
- 二是後續競爭策略。優秀品類必然吸引競爭者。掃地機器人需求廣泛,迅速完成創新擴散,短期內成為紅海並出現淘汰。
Insta360 創始人劉靖康早期長期堅持 “平衡收益與風險”,在垂類市場積累利潤與能力,避免過早進入最激烈競爭。他在 23 年採訪中表示:“長遠看,激烈的競爭不可避免,但我的初衷是,這件事越晚到來越好”。但到 25 年訪談時,我們聊的最多的就是競爭,包括 Insta 360 在一些品類裡從攻到守的變化。
如今隨著 Insta360 旗下影翎無人機發佈,以及大疆推出全景相機,兩家影像公司在多個品類形成交錯競爭、互為攻守。
7. AI 中的人
關鍵詞:天價薪酬與大裁員、使用 AI、意義感
天價薪酬與失業
25 年 11 月在矽谷,一周內聽到的故事高度兩極:有人拿到 Meta 上億美元 offer,有人創業即融數千萬乃至上億美元,也有人因股價與投資獲利;同時也有人清倉、做空虧損,或被裁員。
Amazon 在 25 年 10 月裁員 1.4 萬人,26 年 1 月再裁 1.6 萬人。Layoffs.fyi 統計顯示,Google、Meta、Microsoft 等 25 年共裁員約 6–8 萬人,多為白領崗位。
灣區是 AI 雙面影響的縮影:這裡同時彙集快速增長的 AI 企業、天價人才競爭、屢創新高的股價,以及規模化失業。
關於 AI 對中國人才市場的影響,可見《晚點聊》第 133 期對脈脈創始人林凡的訪談。
從脈脈資料看,中國大廠在激進擴招 AI 相關人才:自 25 年 2 月開始,AI 崗位發佈量的環比增速多月保持兩位數。
一些公司的員工氛圍也在變化。《晚點》在 24 年採訪林凡時,他說阿里員工沒那麼高調了;到 25 年,隨著股價被 AI 預期推高,阿里士氣又回來了,“Make Ali Great Again”。
與此同時,部分崗位需求在縮水。林凡提到,中層管理崗的職位需求減少約 25%。
使用 AI 的人
《晚點聊》第 109 期對卡茲克的訪談中,他作為產品與設計背景的前金融科技從業者,從 23 年開始邊學邊做,逐步把工作流程 AI 化:抓取每日 AI 新聞並用模型排序篩選;尋找 “低粉高贊” 內容並分析傳播特徵作為選題參考。他還用 AI 組織線下活動:從報名留言中篩選真實參與者,並按複雜規則自動分組排座,過去需要多人做幾天的工作,現在顯著節省人力。
他的學習方法是 “干中學”:從真實需求出發;如果不知道做什麼,就從工作中最不想反覆做的部分開始——把重複三遍的事 AI 化。
意義感
我記得 23 年 AI 熱潮初期,有一天看到北大胡泳老師回答:AI 到來後,普通人會面臨什麼挑戰?他當時說:人需要重新理解並感受到,人的意義並不在於工作。
社交媒體上常有 “不想上班、只想躺平” 的調侃,但對大多數人而言,自我認同、成就感與意義感的主要來源仍是工作。
我一直不太相信 “AI 解放工作時間,剩下的歲月就享受生活、愛與和平” 的許諾。我們的教育與環境並未充分鼓勵人們享受生活、尋找熱愛與激情。現在 AI 來了,說工作我替你做,你去享受生活吧——很多人未必立刻具備這種能力。
如果被 AI 替代,首先是失業與經濟問題;即便存在 UBI(全民基本收入),意義感缺失仍可能成為更長期挑戰。
在《晚點聊》第 116 期討論田淵棟小說《破曉之鐘》時提到:短期,人會因資源增加或無法勝過 AI 而產生空虛;隨後轉向 “獨特性競爭”,通過創意與個性證明價值,但過程痛苦,因為不是每個人都有創造獨特性的才華和能力。
但他相信長期可能是樂觀的,社會可能從 “教育—技能—工作—收入” 的循環,轉向興趣驅動的活動,最終出現職業多樣性的爆發,“更多人可能變得更快樂了一些”。
《晚點聊》第 121 期中,當時剛賣掉房子、清理了大量物品,和家人搬進一輛房車裡的黃東旭給出的答案是:體驗——來到這個世界,體驗這段旅程,“大模型不能替你活過”。
自大模型熱潮以來,每個春節似乎都有意外發生:23 年是 ChatGPT,24 年是 Sora,25 年是 DeepSeek-R1,26 年春節,會是什麼?
不管是什麼,它都會出現在我們之後的節目和文章裡。AI 的軌跡仍在延續,我們的記錄也是。 (晚點LatePost)