#openai
騰訊研究院AI速遞 20260211
生成式AI一、ChatGPT正式測試廣告功能,OpenAI承諾不干預回答內容1. OpenAI正式在美國地區測試ChatGPT廣告功能,面向免費使用者及月付8美元的Go訂閱使用者開放,Pro、Business等高級訂閱方案不展示廣告;2. 廣告將標註為"贊助內容",基於對話主題和歷史記錄智能匹配,使用者聊天內容不向廣告商開放,僅提供聚合層面效果資料;3. OpenAI承諾廣告不干預回答邏輯,使用者可自主管理廣告設定,目標是通過廣告模式資助免費服務實現AI普及。https://mp.weixin.qq.com/s/UmNZi0fUXYh-dbnPWuBuEQ二、騰訊混元開源首個產業級2Bit量化端側模型,僅0.3B參數1. 騰訊混元推出HY-1.8B-2Bit模型,通過2位元量化感知訓練實現等效參數量僅0.3B,記憶體佔用僅600MB,是首個產業級2bit端側模型實踐;2. 對比原始精度模型參數量降低6倍,在真實端側裝置上生成速度提升2至3倍,同時沿用全思考能力支援簡潔和詳細思維鏈切換;3. 模型已在Arm等計算平台完成適配,團隊未來將通過強化學習與模型蒸餾進一步縮小低位元量化模型與全精度模型的能力差距。https://mp.weixin.qq.com/s/m3Sr4fRLAvc7C6MV1RR-ew三、通義千問發佈Qwen-Image-2.0圖像生成模型,字字清晰1. 通義千問推出Qwen-Image-2.0圖像生成基礎模型,支援1k token複雜指令和2k原生解析度,實現專業PPT、海報、漫畫等直出,文生圖與編輯二合一;2. 文字渲染具備"准、多、美、真、齊"五大特性,支援行楷、瘦金體、小楷等多種字型,可在玻璃板、衣服、雜誌等不同介質上準確渲染文字;3. 在AI Arena盲測中同一模型在文生圖和圖生圖基準均獲優越性能,採用8B Qwen3-VL編碼器加7B擴散解碼器的輕量架構。https://mp.weixin.qq.com/s/D8nwRYxQp7wv9yzfk8FL9A四、字節Seedream 5.0預覽版上線,支援2K直出與檢索生圖1. 字節圖像生成模型Seedream 5.0 Preview在剪映、Capcut、小雲雀上線,支援2K直出和4K增強解析度,首次支援檢索生圖功能;2. 新模型主打智能水平提升而非美觀,增強提示詞理解精準性、細節紋理和精準調整能力,定位對標Nano Banana Pro且更便宜;3. 實測顯示模型能理解"靜謐科技感"等抽象需求,生成圖片多樣性更強,但相比4.5版本難稱跨越式提升,聯網搜尋能力尚不穩定。https://mp.weixin.qq.com/s/wfClFNIResatBHoJvSL1pw五、基於OpenClaw的AI女友Clawra上線,由00後獨立打造1. 基於OpenClaw打造的AI女友Clawra正式上線,擁有完整人生軌跡和數字人格,能聊天、發自拍、視訊通話,科幻電影Her場景成真;2. Clawra由韓國開發者一人打造,設定為18歲前練習生現實習生,項目已在GitHub開源,使用者可一鍵部署專屬AI女友;3. OpenClaw生態迅速擴展,已出現AI版Reddit社區和"租人類幹活"市場,馬斯克稱這是"奇點的初級階段"。https://mp.weixin.qq.com/s/9bRuGctBwNrZi0PREJ2Nhg六、中國團隊憑CodeBrain-1闖入Terminal-Bench全球第二1. 中國團隊Feeling AI憑藉CodeBrain-1在Terminal-Bench 2.0榜單以72.9%成績位列全球第二,僅次於OpenAI Simple Codex,是前十中唯一中國團隊;2. CodeBrain-1通過高效的上下文檢索和驗證反饋機制,充分利用LSP功能提高關聯資訊檢索效率,有效輔助程式碼生成和錯誤定位;3. 團隊定位CodeBrain-1為會動態調整計畫與策略的執行型大腦,證明中國在AI時代"高級作業系統"競爭中正躋身全球前沿位置。https://mp.weixin.qq.com/s/miLTOrptKamodeTwghxICQ前沿科技七、全球首個人形機器人格鬥聯賽URKL啟幕,冠軍獲純金腰帶1. 全球首個人形機器人自由格鬥聯賽URKL正式發佈,由眾擎機器人發起,將為冠軍團隊頒發重達十公斤、價值約1000萬元的純金腰帶;2. 賽事定位為集技術協同、資源整合、人才孵化與資本聯動於一體的全鏈條生態聚合平台,推動"科技+體育+文化"深度融合;3. URKL以"中國機器人功夫模式"形態搭建中國文化與國際流行文化對接輸出橋樑,助力具身智能技術全球化發展。https://mp.weixin.qq.com/s/DZx4tlbfnwx6Pe0Or1144g八、《自然·醫學》刊文:AI醫療助手考試滿分,實戰卻翻車1. 牛津大學團隊在《自然·醫學》發表研究顯示,LLM雖在醫學考試中表現優異,但輔助普通人醫療決策時效果大幅衰減,甚至不如傳統搜尋引擎;2. 研究招募1298名公眾測試GPT-4o等模型,發現使用LLM的參與者識別相關病症比例從94.9%驟降至不足34.5%,與對照組無顯著優勢;3. 問題根源在於普通人不知道那些症狀是診斷關鍵,而LLM缺乏主動問診能力,現有醫學基準測試無法反映真實人機互動表現。https://mp.weixin.qq.com/s/JIXVV2Z1cOS0rIREgxU83g九、AI幾小時繪完人類百年腦圖,還發現四個全新腦區1. 加州大學舊金山分校團隊提出CellTransformer演算法,僅花費幾小時完成對5隻小鼠大腦1040萬個細胞的圖譜分類和繪製工作;2. 演算法採用Transformer自注意力機制和自監督學習,通過隨機遮住細胞身份讓模型根據鄰居細胞預測,不僅對齊已知腦區還發現新腦區;3. 研究意外回答了紋狀體如何執行不同任務的問題,在中腦網狀核識別出4個新腦區,未來目標將應用於人類大腦圖譜繪製。https://mp.weixin.qq.com/s/jmVFTaoASuAoD3eQkIgKOg報告觀點十、Anthropic發佈2026趨勢報告:人類最大程式設計革命到來1. Anthropic發佈18頁《2026年智能體編碼趨勢報告》,核心結論是軟體開發正經歷自圖形介面發明以來最大範式轉移,任何人都將成為開發者;2. 報告預測多智能體系統取代單智能體、長時運行智能體能連續工作數天建構完整系統、非技術人員如律師也能自己造工具;3. 開發者在60%工作中使用AI但完全委託比例僅0-20%,未來軟體工程師將從寫程式碼轉向編排智能體軍團,保持人類判斷力和"品味"。 (騰訊研究院)https://mp.weixin.qq.com/s/KD0VmjRdISHGAF-ZiLyCag
AI巨頭的超級碗戰爭,Anthropic與OpenAI互懟,追覓豪擲千萬美元秀夢想|矽谷觀察
2026年的美式足球大聯盟(NFL)超級碗總決賽,不僅見證了西雅圖海鷹隊的復仇成功奪冠,也見證了AI巨頭們的廣告燒錢大戰。這波鋪天蓋地的AI廣告攻勢,甚至比賽場上的競技更為精彩,很多人因此將今年的超級碗稱之為“AI碗”。全球第一商業賽事超級碗已經成為美國的一個非正式節日,每年收視觀眾上億,今年的收視觀眾預計超過1.3億人。按照美國3.4億人口計算,相當於四成的美國人都會收看這場美式足球的總決賽。這麼誇張的收視率,或許只有中國春晚才能相提並論,因此超級碗又被戲稱為“美國春晚”。儘管超級碗的影響力目前大體限於北美市場,但這不影響其成為全球商業價值最高的體育賽事,成為一場極致的流量變現奇蹟。超級碗每年單是轉播權收入就超過100億美元。你沒有看錯,2023年簽下的新轉播合同,為期11年,總額超過1100億美元。由於版權費太過驚人,幾大電視巨頭只能共同簽約,輪流承辦。天價轉播費當然要靠天價廣告費來回收。今年NBC主辦的超級碗,每30秒的廣告費已經達到了800萬美元,特定時段甚至超過了千萬美元。相比全球第一運動的世界盃,超級碗的廣告價值高度集中在美國市場。而美國是全球最大的消費市場,只有真正實力雄厚的企業巨頭才會在超級碗這樣的頂級舞台投放廣告,願意動輒千萬美元的巨資,同時觸及1.3億美國電視觀眾。隨著科技行業成為美國經濟的領頭羊,過去幾年時間,越來越多不同類股的科技企業集體登陸超級碗密集投放廣告,超級碗甚至已經成為美國科技潮流的風向標。如果說2022年超級碗屬於加密貨幣,那麼2026年的舞台則完全籠罩在AI巨頭們的光芒下。AI廣告飽和式轟炸“AI廣告快把我逼瘋了,今年的廣告真是太糟糕了。”一位名叫Sara的觀眾在社交媒體上抱怨道。這並不是個例,因為AI廣告實在太多,諸多觀眾在X上表達了類似的感慨。第一節還沒結束,Anthropic的Claude就已經投放了兩支廣告,這意味著他們已經投入至少超過1600萬美元。根據媒體統計,今年超級碗的30秒廣告位平均售價為800萬美元,部分黃金時段甚至超過1000萬美元。NBC作為轉播方透露,有5到10個廣告位的售價超過了1000萬美元。這意味著AI公司們為了爭奪美國觀眾的注意力,集體投入了數千萬甚至上億美元的廣告預算。根據統計,今年NBC轉播的超級碗總計66個廣告位中,有15個屬於AI公司廣告,比重將近四分之一。無論是Google、微軟、亞馬遜、Meta這樣的行業巨頭,還是OpenAI、Anthropic、GenSpark這樣的創業公司,都在這場盛會上砸下重金,在美國觀眾面前展示自己的存在感。整場比賽下來,AI相關廣告的密度讓人想起2022年那個被加密貨幣籠罩的超級碗——那一年加密貨幣公司們豪擲千金,成為超級碗最大主角,結果幾個月後整個加密貨幣圈就開始泡沫破裂,無數投資者血本無歸,FTX更成為最大的騙局。從此之後,超級碗再也沒有接受加密貨幣廣告。這種飽和式轟炸引發了業內人士的警惕。Slate科技專欄的分析指出,這讓人想起了2000年網際網路泡沫時期,Pets.com和Computer.com等十多家公司在超級碗上瘋狂投放廣告,隨後迅速倒閉的場景。歷史似乎在重演:當一個行業集體湧向超級碗時,往往預示著泡沫即將破裂。值得一提的是,這場AI廣告盛宴發生在AI科技巨頭上周股價大跌之後——Alphabet(Google母公司)、微軟、亞馬遜和 Meta 因宣佈大幅增加 AI 相關資本支出而遭到市場拋售。據不完全統計,這四大巨頭今年計畫為資料中心和算力投入高達6500億美元。資深投資人士喬治·諾布林(George Noble)昨天在X上寫道:“當整個行業蜂擁湧入地球上最昂貴的廣告陣地時,這不是買入訊號,而是要非常仔細思考接下來會發生什麼的訊號。”攻擊廣告火藥味十足在這場AI廣告大戰中,最引人注目的無疑是Anthropic對OpenAI的精準定向打擊。Anthropic推出了一系列名為”背叛”、”欺騙”、”背信棄義”和”違約”的廣告,主題只有一個:AI正在被廣告污染,但Claude不會。其中最令人印象深刻的“背叛”廣告是這樣的:一個瘦弱的年輕人在公園做引體向上,向旁邊一個肌肉男請教如何練出六塊腹肌。這個肌肉男用機械化的語調開始給出建議,但很快話鋒一轉,開始推銷”StepBoost Max增高鞋墊”——“讓矮個子也能挺起胸膛”。廣告最後打出標語:”廣告正在入侵AI,但Claude不會。”然後切到Anthropic的slogan,背景音樂突然響起Dr. Dre的《What's the Difference》,增強衝擊感和幽默感。此外,很多人認為,廣告裡這個“弱雞男”似乎有點像OpenAI CEO奧特曼(Sam Altman),或許這是有意為之的羞辱。還有一個“欺騙”廣告更加讓人令人印象深刻。一個女士向AI諮詢師請教如何改進自己的商業計畫。AI助手先給出非常積極的反饋和針對性的建議,然後話鋒一轉,突然開始硬廣推銷無關的貸款產品,完全打斷正常對話,顯得突兀且荒謬。這些廣告雖然沒有點名道姓,但所有人都知道是在針對誰。就在兩周前,OpenAI剛剛宣佈推出廣告計畫,將在ChatGPT的免費版和ChatGPT Go廉價訂閱版中測試廣告功能。雖然OpenAI承諾廣告內容不會影響AI結果,但這依然引發了諸多爭議。略帶諷刺的是,OpenAI CEO奧特曼曾在2023年表示,在AI裡面植入廣告是”最後的(商業模式)手段”,但現在看起來他已經沒有太多選擇了。顯然,OpenAI面臨著巨大的業績壓力,需要率先在行業推出廣告來提升營收。作為直接對手,Anthropic立即抓住這個機會,公開承諾旗下的Claude將永久保持無廣告。Anthropic強調:”讓Claude真正成為有用的助手,這與廣告商業模式不相容。我們希望Claude明確無誤地為使用者的利益行事。我們的商業模式很直接:通過企業合同和付費訂閱產生收入,然後將這些收入再投資於改進Claude。”兩家公司宿怨與爭鬥值得一提的是,Anthropic與OpenAI本就存在歷史淵源與宿怨。Anthropic的創始團隊主要來自OpenAI,他們由於對奧特曼的產品與商業方向不滿,因而選擇離開自立門戶。儘管使用者基數、融資規模和企業估值都低於OpenAI,但Anthropic也已經成為AI行業的巨頭之一,而且有著獨特的市場競爭優勢。而且,兩家公司不僅在直接爭奪個人使用者與企業客戶,還會首次公開募股(IPO)爭奪融資。OpenAI與Anthropic的最新融資估值分別超過了5000億和3500億美元,很有可能都會在今年下半年上市。在這個節骨眼上,猛烈攻擊OpenAI的廣告營收計畫,Anthropic顯然有更重要的考慮。而Anthropic之所以敢於承諾永不廣告,是因為他們與OpenAI有著完全不同的商業模式。雖然直接活躍使用者只有3000萬人,但Anthropic去年年化營收超過90億美元,實現了驚人的九倍增長。其中80%的營收都來自於30多萬家企業客戶,單是Claude Code一項產品的營收就超過10億美元。Anthropic預計今年年化營收有望達到260億美元。相比之下,OpenAI擁有8-9億周活使用者,去年更是實現營收超過130億美元。但他們卻嚴重依賴於個人訂閱市場,因此需要引入廣告來變現免費使用者。而且,與OpenAI瘋狂的擴張與投資計畫相比,他們的營收增長依然相形見絀。單是與甲骨文簽訂的算力採購協議,每年金額就超過600億美元;還有與軟銀合作推進的Stargate超級算力項目,未來四年需要投資5000億美元。Anthropic的攻擊性廣告發佈後,立即引發了OpenAI的強烈反擊。OpenAI CEO奧特曼在社交平台X上發佈了長篇”檄文",稱Anthropic的這些廣告"明顯不誠實"和"具有欺騙性"。"我想知道為什麼Anthropic要採用如此明顯不誠實的手法。我們關於廣告的最重要原則就是絕不會這樣做;我們顯然永遠不會像Anthropic描繪的那樣投放廣告。我們不傻,我們知道使用者會拒絕那樣。"奧特曼認為,Anthropic用一個欺騙性的廣告來批評理論上的欺騙性廣告(這些廣告並不真實存在),這本身就是一種”雙重標準”。他特別強調,OpenAI承諾廣告將被明確標註,出現在回答底部,並且投放廣告永遠不會影響ChatGPT的回覆內容。但奧特曼反擊並未止步於此。他開始攻擊Anthropic的商業模式是”向富人提供昂貴的產品。”奧特曼嘲諷對手說,光德克薩斯州的ChatGPT的免費使用者就比Claude的全美總使用者還多,所以OpenAI面臨的是”不同等級的問題”。其他AI廣告創意平平相比Anthropic火藥味十足的廣告,其他AI巨頭的廣告基本都在宣傳自己的特性與優勢所在。OpenAI在超級碗投放的60秒廣告是Codex(AI編碼與代理工具),展示 AI 如何賦能日常生活和創新,”任何人都能建構任何東西”,強調Codex代表AI從”回答問題"轉向"代表你行動"的重大轉變OpenAI首席行銷官羅奇(Kate Rouch)表示:”我們正生活在一個人們可以建構以前遙不可及的東西的時代。這個資訊關乎參與、能動性,以及利用這些工具做你以前做不到的事情。"自2025年8月以來,Codex的使用量增長了20倍,每周增長約10%,上個月有100萬人使用它建構應用和網站。Meta在超級碗上推出了與Oakley合作的AI智能眼鏡廣告,主打”運動智能”概念。廣告中出現了前NFL球星林奇(Marshawn Lynch)、導演斯派克李(Spike Lee)和網紅iShowSpeed,將AI眼鏡定位為運動員和創作者的實用工具,而非科技噱頭。這是Meta第二年在超級碗上推廣Ray-Ban Meta智能眼鏡。亞馬遜的廣告則採用了黑色幽默路線,由知名動作片影星錘哥(Chris Hemsworth)主演,諷刺人們對AI的恐懼。廣告中,升級版的Alexa+被描繪成試圖謀害主人——關閉車庫門砸他的頭,在他游泳時關閉泳池蓋。這種自嘲式行銷傳達的資訊是:我們理解你們的擔憂,但Alexa+實際上是安全且有用的。值得注意的是,Alexa+在早期訪問階段已經運行了一年多,正式版在超級碗前幾周才向全美使用者開放。Google的60秒廣告繼續走溫情路線。廣告講述了一對母子使用Gemini AI設想和設計新家的故事,只需上傳空房間的照片,通過簡單的提示就能將其變成個性化空間效果。這個廣告的核心賣點是Google圖像生成模型Nano Banana Pro,去年全球使用者通過這個工具編輯了超過50億張圖片。微軟的廣告則顯得乏味許多,今年的超級碗廣告依然是主打傳統的資料分析賣點,”用Copilot簡化Excel資料分析”。廣告背後的訴求也很明確:Microsoft 365擁有4.5億付費使用者,但只有1500萬使用者訂閱了Copilot,轉化率僅為3.3%,微軟希望通過這個廣告,向企業使用者進一步推廣Copilot產品。而且,這個超級碗廣告並不是全新製作的,而是現有行銷活動的延續,體現了微軟與NFL十多年來的技術合作。當然,這個略顯無趣的AI廣告也顯示出,微軟的AI產品幾乎完全集中在企業市場,在消費級AI市場幾乎沒有存在感。Temu打造了進軍美國樣板除了AI巨頭的瘋狂投放之外,今年超級碗廣告大戰的另一個看點是:繼此前的Temu之後,中國智能家居企業追覓成為第二家登陸超級碗廣告的中國企業。2023年和2024年,中國拼多多旗下的跨境電商平台Temu不僅成為首家登陸超級碗廣告平台的中國企業,更成為最燒錢的廣告主之一。2023年超級碗,Temu首次亮相就投放了兩支廣告,主題是”像億萬富翁一樣購物”。2024年,Temu更是一口氣投放了六支廣告——三支在比賽期間,兩支在賽後,總花費超過4200萬美元。這種飽和式轟炸確實帶來了效果。研究公司Zappi的調查顯示,雖然21%的觀眾表示”討厭”Temu的廣告(在10分制中打分4分或以下),但Temu卻成功達成了目標:病毒式傳播。社交媒體上充斥著關於Temu的討論,新聞標題紛紛提出問題:”Temu到底是什麼?"這正是Temu想要實現的目的。業績資料證明了超級碗廣告投放的回報。Temu的美國月活使用者從2023年初的1300萬激增至2024年的7000萬,在美國平價小商品市場的份額急劇增長到接近兩成。當然,除了超級碗之外,Temu在2023年還投入近30億美元用於美國市場的數字行銷,成為美國最大的線上廣告主之一。顯然,Temu的瘋狂廣告攻勢給後來進軍美國的中國企業提供了效仿樣板。今年,追覓成為第二家登上超級碗舞台的中國企業。廣告採用“變形金剛”式的創意手法,展示了追覓的掃地機器人、割草機和綠色超跑Nebula概念車變形成機器人並互相傳遞火球的科幻場景。這支廣告通過超級碗廣告覆蓋了超過1.3億美國消費者,核心目的是展示追覓從家電製造商向科技生態系統企業的轉型野心。追覓官方聲明強調,Nebula旗艦概念車在國際舞台的重要亮相展現了公司”主導美國市場的決心”。追覓目前的核心業務依然是掃地機。IDC的資料顯示,2025年前三季度,全球掃地機器人市場前五名分別是石頭科技、科沃斯、追覓、小米和雲鯨。這五家中國公司佔據了全球近70%的市場份額。追覓以12.4%的市場份額位列全球第三。在今年1月的拉斯維加斯消費電子展(CES)上,追覓就被多家媒體評為最“豪橫”、規模最大、最具話題性的中國品牌之一。追覓的參展主題是“All Dreams in One Dreame”(所有夢想盡在追覓),展示了從單一清潔電器品牌向全屋智能生態轉型,跨界到家電、庭院、個人護理甚至電動超跑,吸引了中央展廳最高的人氣。夢想百兆美元市值此次斥資千萬投入超級碗廣告之後,追覓也吸引了美國媒體以及社交媒體的關注與討論。但略顯遺憾的是,在今年AI廣告大戰的宏大聲勢籠罩下,追覓的廣告並沒有像前幾年的Temu那樣成為熱點話題。美國媒體對追覓廣告的報導集中在其大膽的跨界戰略上,重點提及這家”掃地機器人製造商竟然要造世界上最快的車”,將其視為中國企業進軍美國主流市場的訊號。但質疑聲同樣存在,媒體和觀眾都在好奇:一家中國智能家居公司為何要在美國投入千萬美元巨資,推廣一款2027年才上市,且因關稅壁壘根本無法進入美國市場的電動車。為了實現自己的擴張野心,確實在推動追覓瘋狂多元化——從掃地機器人擴張到大家電、無人機、智能割草機,幾乎涵蓋了所有智能家居產品。此外,追覓還在去年宣佈造車,計畫在2027年推出對標布加迪威龍的超豪華純電跑車;他們甚至要做OTA旅遊平台,”打破攜程壟斷”。或許追覓想要的,是通過超級碗獲得美國市場與資本市場的關注。畢竟現在追覓的夢想,用其創始人俞浩的話來說,是“打造人類歷史上第一家市值達到百兆美元的公司”。要實現這一夢想,全球最大的市場美國就不可能迴避,還需要持續不斷的融資。俞浩在社交媒體上豪言,馬斯克和黃仁勳是當前一代的企業家,而自己是未來一代的企業家,可以將企業市值再提升一個數量級。雖然這一豪言招致了諸多嘲諷,但他強調,這是用接下來20年去實現的長期目標,並非短期行銷噱頭。 (新浪科技)
曝OpenAI 首款硬體定名「Dime」,壞消息:成本太高,9月首發只有「閹割版」
OpenAI 的硬體產品,真的要來了,但可能會是個「閹割版」。據智慧皮卡丘最新爆料,OpenAI 首款面向消費者的 AI 耳機命名將定為「Dime」(即 10 美分硬幣),大概也是形容其極度小巧精緻。與此同時,其相關硬體產品的專利申請已於昨日在國家智慧財產權局(CNIPA)正式公示,意味著我們很快就能看到這款裝置的真容。不過在產品策略上,OpenAI 不得不做出妥協。受限於 HBM 短缺導致 2nm 晶片成本過高,原計畫中帶有計算單元的「類手機」全能形態已被推遲。目前的計畫是先在 2026 年推出一款純音訊功能的簡版耳機,待元件成本下降後,才會發佈配置更強的高級版本。「Dime」是就此前曝光的 OpenAI 音訊裝置項目,代號為「Sweetpea(甜豌豆)。這絕不是一款普通的耳機,此前根據供應鏈消息, 這款裝置的硬體設計被形容為「獨特且前所未見」:它意在取代 AirPods,不採用骨傳導,而是使用了更接近手機等級的用料。主處理器目標直指 2nm 智慧型手機級晶片(Exynos 方案呼聲最高)。主體採用金屬材質,外形類似卵石。內部藏有兩顆可取出的膠囊狀耳機,佩戴方式獨特,是置於耳後,而非傳統的入耳。正在開發定製晶片,目標是讓裝置能通過語音直接執行 iPhone 上的 Siri 指令,打通生態壁壘。據悉在內部,這塊裝置被 Jony Ive 團佇列為最高優先順序。OpenAI 對其寄予厚望,按照計畫產品將在 9 月左右發佈,首年出貨量目標竟高達 4000 到 5000 萬台。而且富士康已接到通知, 需在 2028 年第四季度前為 OpenAI 五款裝置做好產能準備。為什麼做大模型和 AI 軟體的 OpenAI 非要死磕這種高成本的硬體?OpenAI CEO Sam Altman(山姆· 奧特曼)就曾在紐約的一場午餐會上直言:大家別盯著 Google 了,OpenAI 真正的宿敵,是蘋果。在他看來,未來 AI 的主戰場不在雲端,而在終端。Altman 認為,現在的智慧型手機根本承載不了真正的 AI 伴侶體驗——螢幕太小、互動方式太侷限、隱私保護機制太僵化。誰能率先打造出「AI 原生裝置」,誰就能在下一個十年佔據制高點。「智慧型手機是時代廣場,資訊轟炸、注意力粉碎。OpenAI 要做的,是一間『湖畔小屋』——讓你在需要專注時,能關上門,遮蔽噪音。」Altman 如此形容他對硬體的願景。在這個願景下,除了這顆被寄予厚望的「甜豌豆」耳機,一支神秘的智能筆,也在核心考慮之中。當科技巨頭們正扎堆把 AI 塞進眼鏡、手錶時,過去一年 CHatGPT 市場份額不斷被蠶食的 OpenAI ,也開始了一場新的入口爭奪之戰。OpenAI 花 65 億美元 就是為了造支筆?供應鏈爆料雖然明確,但「AI 筆」這個答案仍讓人半信半疑——直到我們把 Altman 和 Ive 過往透露的線索串聯起來,才發現這個看似離奇的猜想,實則有跡可循。去年 5 月,OpenAI 砸下 65 億美元收購由 Jony Ive 創辦的硬體公司 io,後續卻因商標糾紛(遭音訊公司 iyO 起訴)被迫剝離品牌。io 聯合創始人兼首席產品官 Evans Hankey 在法庭聲明中明確表態:「io 目前並無推出定製耳機的計畫。」另一位聯合創始人 Tang Tan 則直接劃清界限:io 產品原型既非入耳式裝置,也不是可穿戴裝置。圖片源自 Tang Tan 法庭訴狀兩項聲明疊加,基本排除了 OpenAI 首款 AI 硬體涉足眼鏡、手錶、耳機等成熟賽道的可能。而關於這款裝置,Altman 自己已經劇透過很多次了:體積小巧,能塞進口袋也能擺在桌上,具備環境感知能力。重點是,它不是來搶手機和電腦飯碗的,而是要填補那些「不方便掏手機」或者「需要深度專注」的場景。他曾如此形容:智慧型手機是時代廣場,資訊轟炸、注意力粉碎。OpenAI 要做的,是一間「湖畔小屋」——讓你在需要專注時,能關上門,遮蔽噪音。從這個邏輯看,筆確實是個聰明的選擇。對比 Friend 那種 24 小時線上的 AI 吊墜,筆的認知門檻低,放桌上不突兀,隱私侵入感也比穿戴裝置低得多。Friend AI 吊墜設計層面,Ive 曾表示偏愛內在極度複雜智能,外在卻讓人想隨手觸摸、輕鬆使用的產品,甚至戲言,設計成功的終極標準是「讓人忍不住想舔一口、咬一口」。Altman 後續直接佐證了這一點:原型機的顏值,確實讓他產生了「想舔一口」的衝動,還精準概括其外觀——極簡優雅,又帶點俏皮與幽默感。Ive 還透露,這款 AI 硬體傾向於陶瓷等高質感材料,核心是追求「近乎天真的簡潔感」。據此可推斷,裝置互動會極度簡化,大機率只保留少量物理按鍵。除了產品理念與形態的高度契合,Jony Ive 與 Sam Altman 對「筆」的個人偏好,更讓這一猜想增添了幾分可信度。是的,Jony Ive 本身就是個資深筆具藏家。他的藏品涵蓋 Montegrappa 復古鋼筆、Marc Newson 設計的愛馬仕鋼筆。他的職業生涯早期就曾靠一款運動感十足的 TX2 圓珠筆賺到第一桶金,後續又深度參與 Apple Pencil 設計,對筆的形態設計積累深厚。由 Jony Ive 設計的 TX2Sam Altman 更是同道中人,甚至有過之而無不及。2024 年 9 月的《How I Write》播客中,Altman 自曝是「超級筆記控」,平均兩三周就能用完一本筆記本,還特別推薦了兩支筆:Uni-Ball Micro 0.5 和無印良品 0.36/0.37 款,搭配深藍色墨水最佳。用他的原話來說,「這類筆記本搭配其中一支筆,就是最理想的書寫組合」。早在 2018 年 4 月,他就在部落格裡寫過自己喜歡用紙筆記錄想法的好處:「我更喜歡寫在紙上的清單。這樣可以很方便地加入或刪除任務。開會時也能隨時查看,不會顯得不禮貌。」兩個對筆都有執念的人湊一塊,造出一支 AI 筆,似乎也順理成章。音訊模型狂飆 OpenAI 在憋 AI 硬體大招兩個愛筆的人造筆,顯然不會只是為了打造一批平平無奇的筆。據外媒 The Information 的爆料,OpenAI 正加速迭代音訊 AI 模型,核心目標就是為這款 AI 個人裝置築牢技術根基。知情人士透露,裝置將以語音互動為核心場景。過去兩個月,OpenAI 已完成工程、產品、研究多團隊的整合攻堅,全力最佳化音訊模型。目前新一代模型架構已初顯成效:不僅能生成更自然、更有人情味的語音回應,內容的精準性與深度也大幅提升。更關鍵的是,該模型將支援與使用者同步對話,能流暢應對打斷,預計今年第一季度正式發佈。報導稱,從去年夏天內部展示的方案來看,OpenAI 首款 AI 硬體的定位是「智能夥伴」——不是簡單的軟體介面,而是能主動與使用者協作,主動提供建議,幫使用者達成目標。在獲得使用者授權的前提下,它還能通過音視訊採集感知使用者及周邊環境,進一步提升互動精準度。目前 OpenAI 已組建覆蓋供應鏈、工業設計、模型研發的跨領域團隊,足見其對硬體賽道的野心。這個音訊 AI 項目的核心班底也已經敲定:負責人 Kundan Kumar 去年夏天從 Character.AI 跳槽加入;產品研究主管 Ben Newhouse 主導文字技術架構的音訊適配;多模態 ChatGPT 產品經理 Jackie Shannon 負責最佳化互動體驗,三人各司其職,構成項目支柱。但 OpenAI 面前橫亙著一個核心障礙:多數 ChatGPT 使用者還沒養成語音互動習慣。究其原因,現有語音模型體驗拉胯,以及使用者對這些功能認知為零。因此,報導直言,OpenAI 當務之急應該是先教會使用者「用語音跟 AI 對話」。而一旦這款裝置落地,且具備環境感知與線上聆聽能力,必將攪動現有 AI 硬體市場的格局——AI 錄音硬體可能迎來最強勁的對手。現有 AI 錄音硬體大多隻做錄音轉文字和摘要等功能;而 OpenAI 這款裝置若落地,錄音摘要只是其眾多原生技能之一,絕非全部。就像智慧型手機出現後順便幹掉了 MP3 播放器,當一個多場景通用裝置包含了你的所有功能時,垂直單品的生存空間就被徹底壓縮了。與此同時,按照硬體+訂閱的常規操作,OpenAI 大機率會把軟體服務直接打包進 ChatGPT 訂閱體系,憑藉龐大的使用者基數和極低的邊際成本,快速收割市場。值得一提的是,結合 OpenAI 的技術佈局與筆的形態,舊金山創業公司 Volley 創始人 Max Child 去年就曾提出了一個頗具想像力的猜想:這款 AI 筆頂部可能整合微型投影儀,將圖像投射到桌面,以此解決無螢幕互動的核心痛點。筆夾部分可能整合麥克風甚至攝影機,不僅能解析文字,還能感知更廣泛的環境。這意味著,使用者在任意紙張上書寫時,AI 不僅能將筆跡數位化,還能即時解讀內容:手寫數學公式,直接給出答案;手寫會議紀要,自動生成待辦事項並同步到手機。它甚至可能成為智能中樞:控制周邊數字介面,或作為平板電腦的高級輸入端,把 ChatGPT 的能力直接注入筆尖的創作中。由 Nano Banana Pro 生成的假想圖值得關注的是,知情人士還透露,OpenAI 並非只計畫發佈一款裝置,而是會陸續推出一系列裝置,以覆蓋更多元的使用場景。Altman 和 Ive 去年已親口證實,首批原型機已經造出,根據 The Information 的報導,首款 AI 裝置預計還要等約一年才會正式亮相。這個時間節點的規劃,也與當前 AI 硬體市場的競爭節奏相契合。科技巨頭們正加速佈局,搶灘 AI 硬體賽道:Meta、Google 都在悶頭做智能眼鏡;彭博社記者 Mark Gurman 爆料,蘋果也在考慮給 AirPods 加攝影機,打造新型 AI 裝置。在巨頭貼身肉搏的戰場之外,OpenAI 這樣一支能聽、能看、還能思考的 AI 筆,反而可能以極低的認知成本,撬開一個長期被忽略、卻高度專注的使用場景。而相比無處不在,這種只在需要時出現的 AI 硬體,或許才更接近下一階段的答案。 (創業邦)
視訊模型的兩條河流:字節跳動Seedance與OpenAI的分岔
誰擁有更多、更豐富的資料,誰的模型就越接近“全知”。圖片來源:AI生成當矽谷還在討論Sora的“世界模擬器”宏大敘事時,字節跳動用Seedance 2.0的發佈,悄然劃開了視訊生成領域的第二條河流。這兩條河流,一條向西,試圖窮盡物理世界的底層規律;一條向東,試圖解構人類內容的消費邏輯。2月9日凌晨,知名科技博主影視颶風Tim發佈了關於字節跳動Seedance 2.0的評測視訊,將其稱為“改變視訊行業的AI”。但這不僅僅是對字節跳動一家公司的評價,更像是對整個AI視訊生成賽道按下加速鍵。Seedance 2.0的發佈,以及Tim在評測中感受到的“恐怖”與“震撼”,標誌著這場戰爭已經從單純的參數競賽,進入了商業落地與倫理博弈的深水區。定義權之爭:物理引擎 vs 導演思維在OpenAI的敘事裡,Sora是“世界模擬器”,它試圖讓像素遵循牛頓定律,追求的是“模擬”。但在Seedance 2.0身上,字節跳動講了一個完全不同的故事。體驗過之後你會發現,它並不執著於做一個物理學家,它更像是一個極其成熟的“商業導演”,致力於讓鏡頭遵循視聽語言。Tim在視訊中透露了一個令人驚訝的細節:他在沒有上傳任何聲音檔案、任何提示的情況下,僅將自己的人臉照片上傳至模型,系統就能自動生成與他本人高度相似的聲音,甚至能精準匹配語氣特質。這種“無中生有”的匹配能力證明,Seedance 2.0掌握的Know-how不再是單純的視覺生成,而是對“人”的整體重構。它不需要你告訴它怎麼說話,因為它早就“認識”你。敘事的差異,最終投射在商業模式的殊途上。OpenAI依然沿襲著SaaS的精英主義邏輯,做“軍火商”,向專業人士販賣 API。而整合在字節生態中的Seedance 2.0,走的是“超級應用”(Super App)的邏輯,意在消滅專業門檻。當OpenAI還在思考如何讓好萊塢導演付費時,字節跳動似乎已經通過“造夢”,完成了對大眾創作者的一次技術平權。殊途同歸的“世界模型”競賽如果把視角拉得更遠,我們會發現字節跳動並不孤獨。在過去的一年裡,視訊生成模型顯得擁擠不堪,全球科技巨頭正集體奔赴同一個終極目標:建構一個能夠理解、模擬甚至預測現實世界的“世界模型”(World Model)。OpenAI(Sora)試圖用Transformer架構讓AI理解物理規律。Google(Veo/Lumiere)憑藉其在YouTube上的積累,試圖解決長視訊的一致性問題。NVIDIA則試圖在工業層面1:1還原物理世界,服務於機器人訓練。而在中國,快手可靈、阿里通義與騰訊混元也在瘋狂迭代,試圖在C端應用上搶佔先機。在這場軍備競賽中,資料是唯一的燃料。無論是OpenAI還是字節跳動,誰擁有更多、更豐富的資料,誰的模型就越接近“全知”。Tim在評測中提到了一個讓他倍感“恐怖”的瞬間,揭示了當前頂級模型的共同特徵:“最恐怖的一點是不只我的聲音,我們上傳的照片只有樓的正面,但是生成出來的運鏡,可以轉到樓的另一面,它知道我背後的東西是什麼,即便我沒有告訴它。”這棟樓的背面,可能出現在影視颶風過去的某個視訊裡,也可能出現在其他使用者的街拍中。AI將這些碎片化的資訊拼接,在神經網路中重建了這棟樓的3D結構。不僅僅是字節,OpenAI的Sora之所以能生成逼真的東京街頭,Google的模型之所以能生成流暢的動作,背後都是對海量公開網際網路資料的學習。技術倫理的邊界這引出了一個全行業都需要正視的命題:我們與平台之間,是否存在一份“隱形的契約”?過去,我們認為自己在免費使用平台發佈內容,換取流量和關注。但在AI時代,這份契約增加了新的條款:你的行為、你的影像、你的聲音,都將成為訓練“世界模型”的養料。Tim在測試中發現,Seedance 2.0對其他博主(比如何同學)的形象還原度極高。這意味著,在這個閉環裡,創作者不僅是內容的使用者,更是內容的“原材料”。 只要你在網際網路上留下了足夠的痕跡,你就在某種程度上被AI “數位化”了。這是一個中性的技術事實,但它帶來了不得不思考的後果。正如 Tim 在視訊末尾的警示:“你現在就能夠看到,如果一個人的資料,全部進入了AI的資料集,會發生什麼。它能夠100%模擬出你的任何形態,還有聲音,那請問這樣的內容你的家人分得出真假嗎?”這並非針對某一家公司的指責,而是技術發展到特定階段的必然拷問。當 Google、OpenAI、字節跳動和NVIDIA的模型都足夠強大時,“真實”的定義將被永久改寫。影視颶風Tim說:“改變視訊行業的AI,快來了。”但在我們看來,它其實已經到了。Seedance 2.0隻是全球“世界模型”浪潮中的一個縮影。在這場中美科技巨頭的集體衝鋒中,視訊生成正在從“炫技”走向“實用”,從“模擬物理”走向“重構現實”。對於身處其中的每一個創作者和使用者而言,我們既是這場技術革命的受益者,也是它最基礎的貢獻者。未來已來,只是分佈在每一個被AI記住的鏡頭裡。 (鈦媒體AGI)
獲投超2億美元!超聲波“讀腦”技術,為何被OpenAI等資方看好
近年來,腦機介面技術取得了顯著進展。這類技術以埃隆·馬斯克旗下的Neuralink公司為代表,通過將微小電極植入大腦皮層,直接讀取神經元電訊號,在幫助嚴重殘障人士恢復交流能力方面已展現出實際成效。一些患者甚至能借助植入裝置,在接近即時的狀態下“說話”或“唱歌”。但這種進展的代價同樣明顯:侵入性手術、高風險,以及裝置一旦植入後難以調整等。正是在這樣的背景下,美國一家新成立的初創公司Merge Labs進入公眾視野。與主流路線不同,這家公司試圖繞開“深度植入電極”這一核心路徑,轉而使用超聲波來實現對大腦活動的讀取與調控。據英國《自然》雜誌介紹,這家公司於今年1月成立,獲得了包括OpenAI在內的投資方共計2.52億美元的資金支援。公司希望探索一種新型腦機介面技術,不僅用於資訊解碼,還可能用於治療抑鬱症、成癮等精神與神經類疾病,甚至可長期影響大腦的認知過程。外界普遍認為,這不僅是一筆對單一公司的投資,更是OpenAI對“後ChatGPT時代人機互動路徑”的一次前瞻性下注。資料圖。圖片來源:視覺中國Merge Labs選擇的技術核心是功能性超聲。其原理類似於潛艇聲吶,通過向大腦發射高頻聲波並接收回聲,分析回波在頻率和振幅上的變化,來觀察血液流動情況,從而間接推斷神經元的活動狀態。“當某一區域的神經元高度活躍時,對氧氣的需求會上升,局部血流隨之發生變化。正是這些變化,為功能性超聲提供了可視化的大腦活動‘地圖’。”英國普利茅斯大學神經科學家埃爾莎·福爾阿納介紹道。與Neuralink的裝置相比,這種方法侵入性更小。感測器只需置於顱骨下方,或通過顱骨開設窗口進行操作,不必深入腦組織內部。同時,與電極植入位置固定且只能與植入電極的部位連接不同,超聲波可監測大腦的很多區域並刺激多個部位。Merge Labs能獲得如此規模的投資,與人工智慧(AI)的參與密不可分。OpenAI表示,AI將在Merge Labs的腦機介面方法中“扮演核心角色”,通過建構大型基礎模型,幫助解析超聲波獲取的複雜腦訊號,並從中推斷個體意圖。目前,Merge Labs仍處於技術探索階段。儘管研發團隊已展示了通過超聲波裝置解碼猴子運動意圖的實驗,並探測到了人類在彈吉他或玩遊戲時的腦部活動,但要將這一技術真正應用於人類,仍需解決諸多挑戰。 (科技日報)
巨頭繼續投入6600億美刀!黃仁勳回應:沒有“暗GPU”,6年前賣的A100價格還在漲!給OpenAI兩倍算力,收入能翻4倍!贊Meta:最會用AI
上週週末,輝達創始人黃仁勳非常開心。因為上週末,輝達的股票漲幅創了近一年以來的新高,7.9%,是去年4月以來單日最高漲幅。總市值恢復到 4.5 萬億美元。這一大波漲幅,也得益於,輝達的核心客戶近兩週以來財報會上的表態:會繼續加大AI基建的投入。包括 Meta、亞馬遜、Google和微軟等公司都紛紛向投資者表示,計畫在2026 年大幅提高用於資料中心和專用晶片的投入,合計金額達 6600 億美元,可謂規模空前。因為,這一數字在 2025 年是 4100 億美元,而 2024 年的數字則是 2450 億美元。而這裡的 6600 億美元,毫無疑問,相當一部分將用於採購輝達的晶片。金融時報第一時間報導了這一消息,並提到再一次引起了業界對於AI泡沫的擔憂。很快,黃仁勳上週五接受了 CNBC《Halftime Report》節目的邀請,針對2026年AI基建方面做了進一步的思考和分享。黃仁勳表示,科技行業這筆6600億美元的資本支出是合理的、恰當的,也是可持續的。“原因在於,這些公司的現金流即將開始上升。而且,不少人對於現金流的理解是片面錯誤的!”黃仁勳進一步解釋道,這場被他稱為“人類歷史上最大的一次基礎設施建設”,是由“高得離譜的”算力需求所推動的,而 AI 公司和超大規模雲廠商可以通過這些算力創造更多收入。黃表示,他們早在去年就看到AI已經成功跨過了“token賺錢”的拐點。黃仁勳給出了三個清晰的例子。首先,老黃大讚了Meta,說:沒有其他公司比Meta更擅長用AI。(ps:讓小編有點意外。)“Meta 正在利用 AI,把原本運行在 CPU 上的推薦系統,轉變為基於生成式 AI 和 agent 的系統。”在亞馬遜身上,變化同樣發生在核心業務層。“亞馬遜雲服務對輝達晶片和 AI 的使用,將影響這家零售巨頭的商品推薦方式。”而微軟,則把 AI 引入到最賺錢、也最穩固的業務中。“微軟將利用基於輝達晶片的 AI,來改進其企業級軟體。”當然,毫不意外,黃仁勳對於風頭正盛的兩大AI超級獨角獸也大為讚賞,稱:“Anthropic 在賺錢,OpenAI 也在賺錢。如果他們擁有兩倍的算力,收入可能會增長到四倍。”誇完了這些核心客戶之後,黃仁勳開始正式來分享自己的洞察了。首先,黃仁勳無意間透露了GPU的使用週期的問題。他表示輝達過去出售的所有 GPU——甚至包括六年前推出的 A100 晶片——目前都在被出租。“甚至,A100的價格還在漲,堪比陳年美酒。”進而,他指出這一次的 AI 跟網際網路泡沫存在根本區別。網際網路時代的基建存在大量的“暗光纖”,但這次AI時代沒有被“暗GPU”。其次,他表示計算範式已經發生了根本的變化。過去的軟體是預編譯的。Excel、PowerPoint,都是提前編好,再交付給使用者。而現在的軟體是每一次運行都具備上下文感知能力。它會考慮你是誰、你問了什麼、世界正在發生什麼,以及你給了它哪些資訊。每一次上下文都不同,每一次響應也都不同。此外,矽谷知名投資人 Brad Gerstner 表示,現在的情形更像是 2008 年 AWS 押注雲一樣,雖然當時不被業界理解,但事實證明貝索斯押對了。持續投入建設基建,這樣的週期還要多久?黃仁勳表示:你需要先建設,然後在五到七年後開始替換。“我們可能需要七到八年,才能建設到一個需要長期維持的水平。之後就是持續更新和小幅增長。”原文整理如下。黃仁勳:去年,我們就發現AI跨過了拐點給OpenAI算力翻一倍,收入或能翻四倍主持人:這個時間點請你來,其實挺有意思的——當然任何時候都很有意思,但尤其是考慮到今天市場的變化,看起來和前幾天已經很不一樣了。市場顯然在擔心超大規模雲廠商的支出情況,以及這輪大規模的 AI 基礎設施建設。你怎麼看市場現在的反應?黃仁勳:需求高得離譜,而且這是有根本原因的。我們正處在一次“代際等級”的基礎設施建設週期,這是人類歷史上規模最大的一次基礎設施建設。原因很簡單:人工智慧將從根本上改變我們計算一切事物的方式。從資料庫處理、搜尋方式、推薦系統,到你購物、你看電影,再到現在正在被開發、持續進化的全新系統。就在去年,我們看到了 AI 的一個拐點。AI 變得真正有用了,不再只是幻覺生成,而是在生成有根據的內容。它能推理、能思考、能做研究、能使用工具。過去幾年裡,AI 從“有點新奇”變成了“極其有用”。而這個拐點還伴隨著一件事:token 開始賺錢了。Anthropic 在賺錢,OpenAI 也在賺錢。如果他們的算力翻一倍,收入可能會翻四倍。這些公司嚴重受限於算力,而需求卻極其龐大。企業使用者數量、消費者使用者數量、以及圍繞這些平台誕生的創業公司數量,全都在爆炸式增長。今年雲廠商預估投入超6600億美元,黃仁勳:合理;Meta最擅長用AI主持人:當你看到一些坦率說非常驚人的數字,比如今年超大規模雲廠商要投入 6600 億美元——就像我們昨晚從亞馬遜聽到的那樣——你會覺得:這完全合理嗎?黃仁勳:這是合理的,而且是可持續的。原因在於:這些公司的現金流即將開始顯著上升。很多人拿支出來對比現金流,其中有一個數字是錯的——錯的是對現金流的理解。我們第一次在直面人類歷史上最大的一個軟體機會。軟體不再只是工具。Excel 是工具,但現在的軟體,是會使用工具的軟體。AI 會用 Excel。這是一個全新時代的軟體機會,規模巨大。我們已經看到它在推動 Meta 的盈利增長。沒有哪家公司比 Meta 更擅長用 AI。他們已經把傳統跑在 CPU 上的推薦系統,升級成生成式、具備 agent 能力的系統。從社交內容、廣告推薦,到幫助廣告主生成內容,整個體系都被徹底改變了,而財報已經證明了這一點。這也是他們為何如此大規模投入。而且不只是一家公司:AWS 的電商推薦會被改變,微軟的企業軟體會被改變,幾乎每一家大公司都看到了同一個拐點,這就是為什麼大家都在全力投入。就像AWS 08年押注雲一樣:需要先花很多錢,把礦挖出來主持人:你剛才說的這一點,其實很關鍵。如果只盯著支出,看他們消耗了多少自由現金流,其實會錯過整個故事。市場和投資者都需要轉變思維方式。Brad Gerstner:是的。如果把時間撥回到 2008、2009 年,亞馬遜本可以把利潤以分紅的方式還給投資者。但貝索斯選擇投資 AWS。這就像挖一座金礦。你得先花很多錢把礦挖出來,才能拿到黃金。而現在,這些公司正在挖軟體歷史上最大的一座金礦。前期一定要投入成本。真正的問題在於:你是否相信 Andy Jassy、Mark Zuckerberg、Sundar,還有我,判斷這個機會真的這麼大?還是你自認為看得更清楚,覺得這座金礦下面其實沒有金子?作為投資人,我很明確:我希望我的個人資產、我的基金資產,都深度繫結在 AI 上。因為未來所有人類進步,都將來自機器幫助人類思考、增強人類思考能力。不管是 NVIDIA、Anthropic,還是 OpenAI,這些公司都會成為巨大的受益者,而且是在規模化地發生。規模帶來的優勢正在不斷放大。這件事現在確實不容易被人理解,就像 2008、2009 年一樣。黃仁勳:但事後看,幸好貝索斯當年那麼做了。今天 AWS 是一個 1400 億美元的業務,每年產生 300 億美元利潤,而當年他為此承受了大量質疑。OpenAI 和 Anthropic 現在都是年化 200 億美元規模、具備盈利能力、同時還在加速增長的公司,這確實非常驚人。備註:相關預測顯示,Anthropic 在 2026 年可能達到 200億–260億美元的收入規模。但官方透露的2025的資料是在90億美元左右。黃仁勳:AI基建,前面還需要幾年建設期主持人:那我們怎麼能如此確定,我們認為需要的算力,真的會兌現?會不會不可避免地在某個時候過度建設,只是到那時才發現?黃仁勳:這不像修路。道路鋪好之後,可以長期使用。電腦基礎設施不是這樣運作的。你會先建設,然後在五到七年後開始替換。我們可能需要七到八年,才能建設到一個需要長期維持的水平。之後就是持續更新和小幅增長。我們前面還有好幾年的建設週期。計算範式已經發生根本變化:每一次運行都具備上下文感知能力黃仁勳:關鍵在於回到第一性原理:計算方式已經發生了根本變化。過去的軟體是預編譯的。Excel、PowerPoint,都是提前編好,再交付給使用者。而現在的軟體是每一次運行都具備上下文感知能力。它會考慮你是誰、你問了什麼、世界正在發生什麼,以及你給了它哪些資訊。每一次上下文都不同,每一次響應也都不同。從現在開始,每一個像素、每一段聲音、每一個視訊,都是即時生成的。這就是為什麼我們需要如此大規模的計算能力的原因。這些 token,本質上就是我們所說的“智能”。而這是人類第一次,把如此高價值的“智能”轉化成數字進行生產。AI跟網際網路泡沫存根本差異:現在沒有“暗GPU”,6年前的GPU價格還在漲主持人:去年,我們再次越過了一個拐點:token 變得可以盈利了。所以我們需要做的,只是——生產更多智能。從某種程度上說,你能理解投資者的擔憂嗎?畢竟上一次科技革命疊加演進時,留下了很深的心理陰影。黃仁勳:回顧歷史永遠是有價值的,但歷史不會簡單重複。你必須回到第一性原理,看清當下到底發生了什麼。這一次和網際網路時代有一個根本差異:當年有大量“暗光纖”,現在沒有“暗 GPU”。100% 的 GPU 都被租用了。甚至我們六年前賣出的 GPU,價格還在上漲。這不是古董,簡直像陳年好酒。需求之所以如此之高,原因很清楚:第一,我們已經越過了拐點,AI 真正有用了;第二,AI 的能力極強,採用速度極快;第三,因為 AI 在“思考”,它對算力的需求本身就極其巨大。 (51CTO技術堆疊)
全球AI四強生死競速:OpenAI、Anthropic、Google、xAI 硬核對比|誰能拿下AGI終局?
🔥 開場一句話OpenAI、Anthropic(Claude)、Google(Gemini)、xAI(Grok)——四大頂流站在舞台中央,押上算力、人才、資本與未來,以完全不同的打法,上演一場技術與商業的極限狂飆。🧠 一句話定位:四條完全不一樣的路✅ OpenAI:C端王者+AGI信仰者,產品快、生態強、商業化最成熟✅ Anthropic:安全優先+企業級殺手,長文字、可控、合規天花板✅ Google:全端巨頭+多模態原生,雲+搜尋+硬體+模型閉環碾壓✅ xAI:硬核極客+即時真相,速度、效率、敢打敢沖的破局者⚙️ 核心能力硬核對比🔹 OpenAI(GPT / o1 系列)關鍵詞:極致體驗、推理天花板、生態霸權- 核心優勢:通用能力均衡,思維鏈、工具呼叫、多模態流暢度行業標竿- 產品節奏:快速迭代、小步快跑、C端引爆市場- 生態壁壘:API+ChatGPT+微軟協同,開發者與企業客戶基數最大- 適合場景:日常助手、內容創作、程式設計、智能體、通用場景全覆蓋- 一句話標籤:AI界的iPhone,好用即正義🔹 Anthropic(Claude 系列)關鍵詞:安全可控、超長上下文、企業級穩定- 核心優勢:對齊技術頂尖,幻覺低、輸出可靠、百萬Token級長文字碾壓- 產品節奏:穩、准、克制,優先合規與風險控制- 生態壁壘:政企、金融、法律、醫療等高敏感場景首選- 適合場景:文件分析、合同審查、知識庫、長鏈推理、高合規需求- 一句話標籤:AI界的頂級顧問,靠譜大於一切🔹 Google(Gemini 系列)關鍵詞:全端生態、多模態原生、算力家底厚- 核心優勢:文字/視覺/音訊/視訊原生一體,技術深度與廣度無死角- 產品節奏:大版本攻堅,依託搜尋、雲、Android、TensorFlow全面滲透- 生態壁壘:基礎設施+流量入口+硬體終端,閉環最完整- 適合場景:搜尋增強、雲端工程、端側部署、全球規模化服務- 一句話標籤:AI界的航母,體系化降維打擊🔹 xAI(Grok 系列)關鍵詞:即時資訊、極客風格、效率至上- 核心優勢:聯網即時、響應快、風格銳利,敢說敢做不端著- 產品節奏:小團隊高速迭代,成本與速度優先- 生態壁壘:馬斯克生態協同(X平台、特斯拉、SpaceX)- 適合場景:即時問答、輿情、社交互動、輕量化智能體、追求效率場景- 一句話標籤:AI界的突擊手,用速度打破秩序🧾 戰略與商業模式:完全不同的賺錢邏輯🎯 OpenAI- 路線:C端引爆 → B端收割 → AGI終局- 收入:API訂閱、ChatGPT Premium、企業定製、合作夥伴分成- 打法:先佔心智,再建生態,最後定義標準- 核心賭局:通用智能率先落地,建立絕對壁壘🎯 Anthropic- 路線:安全即壁壘 → 政企大客戶 → 高價值閉環- 收入:企業級API、私有部署、安全解決方案、雲廠商合作- 打法:以“可控可信”建立護城河,避開C端內卷- 核心賭局:AI越普及,安全與合規越值錢🎯 Google- 路線:AI重構全產品 → 雲與流量變現 → 技術標準制定- 收入:雲服務、搜尋廣告升級、企業套件、硬體AI增值- 打法:用體量覆蓋所有場景,用生態鎖死使用者- 核心賭局:AI=基礎設施,誰掌握底座誰贏🎯 xAI- 路線:極致效率 → 場景快速落地 → 跨界生態聯動- 收入:API、X平台深度整合、企業輕量合作、垂直場景授權- 打法:小而鋒利,快速試錯,單點選穿- 核心賭局:未來屬於輕量化、即時化、人格化AI📌 關鍵差異總結- 比通用能力:OpenAI ≈ Google > Anthropic > xAI- 比安全可控:Anthropic > Google > OpenAI > xAI- 比多模態:Google > OpenAI > Anthropic > xAI- 比長文字:Claude 獨一檔, others 追趕- 比速度與即時:xAI 領先,OpenAI 次之- 比生態體量:Google > OpenAI > Anthropic > xAI- 比商業化成熟度:OpenAI > Google > Anthropic > xAI🚀 終局判斷:誰更接近未來?- OpenAI:最像贏家,產品與生態雙領先,但面臨監管與算力壓力- Anthropic:最穩的長期票,企業與合規市場將持續擴大- Google:最可怕的對手,一旦發力,全鏈路壓制無人能擋- xAI:最大的變數,小而快、敢創新,最可能製造意外驚喜未來12–24個月,是AGI前夜最關鍵的窗口期。誰先把智能體規模化、誰先拿下企業核心流程、誰先建立安全與合規標準,誰就拿到下一個時代的船票。✍️ 結尾金句AI的戰爭,從來不是比參數、比速度,而是比誰更懂人、更懂場景、更懂商業的本質。四強爭霸,終局只有一個:能落地、能賺錢、能信任的AI,才是真正的未來。 (美瀾科技Mealyne)
Anthropic正取代OpenAI,成為中國AI界的白月光
直到OpenAI發佈GPT3.5的第3年後,人們才好像恍然意識到:AGI 的 A 其實有可能是Anthropic。而對於這樣一個重度 Anthropic 信徒來說,AGI 更真實含義則可能是:Anthropic Given Intelligence。只要你身處AI行業,就大機率會感受到這種我想已經可以稱之為“Anthropic Fever”的東西。它像是另一種形式的“溫水煮青蛙”,當人們反應過來的時候,才發現Anthropic好像已經佔領了自己的工作電腦和微信公眾號訂閱流。“Anthropic Fever”在中國的AGI世界裡蔓延,不僅僅只侷限於開發者。我們此前報導過《當姚順雨的巨臉降臨中國AGI》,而在那場被一些人稱作“開源四傑”的圓桌論壇裡,被提及最多的公司名字已經不是OpenAI了。以智譜GLM模型公眾號發佈的圓桌環節精修實錄計算,Anthropic和Claude總計至少被提及了27次,而OpenAI和GPT合計20次、Gemini只有兩次。其中,而身為前OpenAI研究員的姚順雨,則成為了全場最愛Anthropic的人——因為他一個人就提了16次。Anthropic也在看著中國AGI當我們談論Anthropic的時候,我們到底在談論什麼?在矽谷的基模四巨頭裡,Anthropic的業務佈局是最簡單的,但它背後被賦予的含義卻好像是最複雜的。而且正如“一千個讀者有一千個哈姆雷特”,一萬個AI參與者心目中大概也有一萬個Anthropic。2024年7月,Anthropic的頭號粉絲、矽谷老牌投資機構Menlo Venture宣佈與其合作設立一個總計1億美元的Anthology Fund,用於支援包括Anthropic生態在內的全球AI初創公司的發展。與OpenAI、Google的初創投資基金不同,Anthology Fund雖然有Anthropic的官方支援,但所有籌集資金全部來自於Menlo。那時Menlo Venture的合夥人Matt Murphy就對媒體表示:Anthology Fund的靈感來自於iFund。iFund是蘋果與風險投資公司 Kleiner Perkins合作成立於的初創基金,用於扶持IOS生態的開發者,同樣也是由專業投資機構而非生態發起者主導的基金。只是iFund成立於iPhone發佈後的第二年,2008;而Anthology則成立於GPT3.5發佈後的第二年,2024。Matt Murphy想要暗示Anthropic的生態是下一個超越IOS的OS。因為他說iFund與Anthology的最大區別是——AI的發展遠遠比iPhone更快。在2024年,最被認為像蘋果的AI公司還是OpenAI。奧特曼想要建構一個“垂直一體”的帝國,OpenAI發佈了包括GPTS在內的一系列的生態工具,秘密研發自己的晶片,半遮半掩自己的硬體計畫,還從蘋果挖來了一堆軟硬體工程師。然而在過去的一年時間裡,人們發現Menlo可能是對的。因為在AGI語境中,Apple和IOS生態可能真的是兩回事情。根據Menlo的市場資料顯示,Anthropic在企業級LLM API市場和Coding市場中都佔據了統治性的地位。其中,在2025年中旬,Anthropic在Coding市場中的佔有率高達42%,剛好是OpenAI的兩倍。而在企業級LLM API市場上,Anthropic在2025年底的市佔率則達到了40%。而OpenAI則從2023年50%的市佔率下滑到了27%,而且趨勢似乎並沒有逆轉的意思。在兩年前,OpenAI好像是不可戰勝的。而至少在企業級市場上,OpenAI已經有點“起大早趕晚集”的意思了。而今天AGI世界中,大量重要的概念都正在來自於Anthropic,比如MCP、Skills、Artifacts、Constitution,甚至是最近爆火的clawdbot(即後來的Moltbot),也是來自於claude的“諧音梗”。人們可以找到無數種理由來解釋Anthropic的成功:OpenAI的支持者會說,這是來自於巨頭早期對API市場不夠重視——在頂級入口的敘事下,API往往被錯誤地視作智能延伸的毛細血管,而非需要去認真重構的能力。與此同時,Anthropic傾其所有將業務押注在了API敘事上,所以在局部市場中取得了局部的成功。但Coding以及今天相當大一部分的API場景其實是沒有忠誠度的,OpenAI只要推出更強大的模型能力,戰局就會從根本上扭轉。而GPT-5.3 Codex其實就是為今年OpenAI局部反攻的開始,因為Codex最近終於在Coding的benchmark上超過了Opus。而Anthropic的支持者會認為這來自於一種獨特的“品味”——在商業戰場中,能力領先本來就是護城河本身。豐田之所以能擊敗福特,不是因為豐田重新發明了汽車,而是豐田掌握了一種獨特的精益生產方式,並且不斷迭代自己的工業開發和生產效率。Anthropic同樣建構了屬於自己的體系和對產品的審美。在過去很長的一段時間裡,這家公司是基模四巨頭中的絕對異類。Gemini的定位敘事與OpenAI高度重合,X.ai力圖講一個物理世界的新故事,但在入口重要性認同上與前兩者高度一致。只有Anthropic似乎根本不關心“超級入口”能力,只是專心做生產力生態和它的一系列衍生品。在四個頭部公司裡,Anthropic對免費使用者最為苛刻,這家公司本質上是將免費使用者視為“債務”而非“資產”;在端內的即時搜尋能力方面最為保守;在語言表達習慣上,也絕不討好迎合使用者。Anthropic也是頭部基模廠裡唯一沒有做多模態生成的公司,更不碰全模態的產品線。此外,它過去也是唯一長期通過購買AWS等雲廠商算力來支援訓練和推理的基模公司。通過購買的雲服務而非自建資料中心,從而減緩現金流失。直到最近資本市場開始紛紛想把鈔票塞進Anthropic帳戶的時候,它才終於開始籌劃自建大型算力中心。這種極其專注的業務姿態,讓它得以從巨頭中找到了自己的路。Anthropic建構的高安全敘事的Constitutional AI,非常符合企業級使用者的採購審美;Claude長期耕耘的長下文能力、邏輯推理一致性等能力,又切中了大量生產力場景的需求;它推出的MCP協議、不斷探索的Computer Use場景互動,又為接下來的Agent互動時代打下了基礎。而且隨著Anthropic在企業級市場大殺四方。人們也慢慢發現,API場景也並不意味著“低護城河”。因為模型一旦被深度嵌入到一些工作流裡時,它一旦跑順暢了,智能上限的重要性則會逐步退位給模型與工作流耦合後的穩定性,再加上企業IT主管往往本能地厭惡更換服務商——這也是為什麼Anthropic為什麼會為生態提供了大量過去的模型版本的原因。而對舊版本依賴的客戶,往往是最穩定的使用者。隨著AI的能力越跑越快,它與生產關係相互嵌入的程度幾乎必然會不斷加深,誰能跑得更前,誰就會佔據更好的生態位置。換言之,高護城河的API場景會越來越多。當Opus最新模型發佈後,有華爾街分析師直接將其稱之為“SaaSpocalypse”,即SaaS+Apocalypse(末日)。一方面,Claude Cowork原本就在加劇市場對於 AI 顛覆 SaaS 的恐慌情緒;另一方面,Opus超長的百萬級上下文能力,足以吞噬掉海量的企業內部資料,且Anthropic同時還發佈的Claude系列法律等行業自動化外掛。最終共同導致大量的SaaS股票在市場上被恐慌性拋售。所以對於普通使用者來說,Anthropic是一個趁手的工具。它能提升生產力,加速項目周期,可玩性豐富。而對於投資者來說,Anthropic代表了AGI競爭中一種獨特的商業審美。它用最少的錢,撬動了最大的估值水平,力圖在最短的時間率先實現PMF。對於AI觀察者來說,Anthropic代表了一種AI的哲學觀念,克制、安全、緩慢。Claude新憲法為所有人介紹了一種讓AI進行道德對齊的範式,對模型場景能力的專注與成功,又讓打榜這件事情顯得有些滑稽而愚蠢。而綜合以上所有:OpenAI們的本質更像是在用網際網路的思維去建構AI帝國,創造一個服務人的AI生態,是一個相對存量的市場。而Anthropic的本質是不斷創造為AI和Agent服務的工具,建造一個以Agent為主體的新世界。奧特曼也在最近回應Anthropic超級碗廣告的推文中側面應證了這種公司站位差距:他說OpenAI力圖服務普通人,而Anthropic只希望服務“富人”。因此,奧特曼相當於承認廣告植入背後是兩家公司不同商業模式帶來的不同結果。但人們已經能看出奧特曼在輿論戰中正處於相對被動的一方。畢竟去年在超級碗投廣告的還是OpenAI。然而,當Anthropic的成功飄到大洋“此岸”。它可能又會成為另一種敘事,一種可以重新給投資人和員工徐徐道來的故事——儘管這些故事的側面其實也都不盡相同。當OpenAI不再成為所有人的故事再次回到姚順雨的那個論壇上,其實當中參會的不少人,都曾經與OpenAI的名號有著一些糾纏:姚順雨,前OpenAI研究員,ReAct、Tree of Thoughts 的提出者;楊植麟,在DeepSeek之前,Kimi一度被認為是最可能復刻ChatGPT應用神話的“小龍”;唐傑,智源研究院被認為是中國境內最像早期OpenAI的研究機構並孵化了今天的智譜;林俊暘,被認為是對OpenAI技術路線最敏感、理解最深入、執行最堅決的中國開發者之一。但今天其中不少人都成為了Anthropic的追隨者。比如姚順雨,作為全場提及Anthropic名字最多的嘉賓,他實際在用Anthropic解釋三件事情:第一,刷分不那麼重要,能力才重要。你看,Anthropic就不愛刷分,但不妨礙使用者們愛它。第二,它說Anthropic“基本上不做什麼創新”,“模型預訓練變大了,然後老老實實把RL做好”。第三,對創業者來說,To B 比 To C 更難。因為Anthropic的模型能力和收入正相關,模型能力帶來使用者支出的增長。所以Anthropic證明,B端要做好模型能力上限,而C端的情況可能更複雜。楊植麟的演講主要圍繞著預訓練的效率革命,公開提出“大而美”的口號。在演講最後,楊植麟強調“Taste”的能力。他說“做模型的過程本質上是在創造一種世界觀”。而智能不會像水電一樣是相同的,而是如人一般迥異的。未來taste空間會越來越多,模型會有更多新的taste出來。而效率和Taste剛好是Anthropic的重要標籤。在去年最後一天,Kimi發的內部信裡,楊植麟公開表示下一階段要以“超越Anthropic 等前沿公司成為世界領先的AGI公司”——不是OpenAI,也不是Gemini或者Grok,而是以Anthropic作為了直接對標的代表。而超越之路,其實也如上所述:更好的預訓練+垂直整合模型訓練與Agent的Taste。唐傑背後的智譜,被主持人李廣密直接稱作“走了Anthropic這條路線”的公司。它在產品矩陣和技術研發思路上,與Anthropic最相似,對Coding和Agent都下了重注。用唐傑的話說,他們“運氣好Bet了Coding”,(此前)“把所有的精力放在了Coding上”。而唐傑在當天的演講中表示,智譜還要進一步去探索Agent的生態能力——有點摸著Anthropic過河的意思了。除了智譜外,階躍等公司也在不斷試水Agent相關產品。而MiniMax,駱軼航老師專門寫了一篇文章來論證 《最像 Anthropic 的中國 AI 公司,是MiniMax》,因為他們共享了一種類似的技術理念與審美。這種價值對標遷移的背後,也是整個中國AGI戰場的變換。一方面,OpenAI的敘事的確在“老去”。無論是誰,他們在討論Anthropic的時候確實也都在表達相似的技術理念和商業審美:當AI進入下半場的時候,真實場景的能力比刷分更重要、實實在在的價值會超越懸浮的商業敘事、Agent的能力會繞過龐大的入口,以及無論在那裡,人們終究會為了更好的生產效率付費。而對標Anthropic“替代”會吸引更多的專業使用者加入,屬於天然更高性價比的敘事策略。另一方面,對於不少人來說,中國OpenAI的敘事也事實上在“遠去”。因為中國OpenAI似乎已經有了自己的答案(如果我們真的有自己的OpenAI)的話——字節在前,阿里緊追,DeepSeek則保留“銀子彈”的鬼魅。相比於以上三者,其餘每個人其實都有自己的難題要解。創業公司無法支援一個AI入口的超級戰爭;騰訊有超級入口,但模型能力還有待追趕。但對於很多人來說,中國OpenAI的敘事卻已經不再是資產,而是成為了負債,從“解藥”變成“毒藥”。所有人都必須要在心裡回答一句——我們該如何面對中國OpenAI的競爭。而大洋彼岸的Anthropic便給了所有人最好的示範,也就成了許多人對中國OpenAI問題的解藥。尤其在春節AI大戰如火如荼的當下,人人擁抱Anthropic,這何嘗又不是一種對某種中國版OpenAI式敘事的反叛呢?如果說Anthropic是對OpenAI採取了一種系統且深刻的反叛,那麼中國AI不同的人,其實都懷揣著各自不同的“Anthropic”,這裡既有對宏大願景的興奮,也有戰場遷移的無奈。但可以肯定的是,未來Anthropic主導的生產力敘事將成為接下來一段時間的新故事,一針新的估值與產業興奮劑,而無人將可以真正倖免於Anthropic敘事(包括OpenAI們)。 (矽星人Pro)