#OpenAI
穩准狠!輝達反擊Google和OpenAI
打蛇打七吋這不,黃仁勳著急了,Google和OpenAI一唱一和給輝達挖坑才說完兩天時間,輝達現在就直接跟Groq合作要做TPU了!Groq跟Google的TPU技術相似,不過比Google的脈動陣列核心做得更徹底,直接限制資料不能調整各個方向傳播,單方向流水線架構。加上純一級快取高頻寬,依賴編譯器生成靜態計算圖。結果就是編譯器比Google TPU要更簡單更快。也是產品架構足夠簡單,所以才能最快速度量產商業化。但缺點是不能用來做AI大模型訓練。現在,輝達的反擊快准狠,直接拉到了Groq合作做TPU,也是很有意思!TPU這種AI晶片的核心是,編譯器和靜態計算圖技術,這個編譯器必須適配現在的AI開發生態,還不能太複雜,太複雜的話開發和維運周期太長,可用性低。之前專門解釋過這個事靜態計算圖是如何幫Google Tensor TPU超越輝達GPU性能的?輝達有市場必用的AI軟體框架CUDA,Groq的兩者張量流架構做到了最簡單,兩家高度互補!這兩家合作直接對Google的XLA和OpenAI的Triton直接釜底抽薪!讓兩家軟體優勢一夜之間還沒雄起,就殘血大半。為何Groq晶片性能那麼強?Groq的指令集架構(ISA)非常特殊,它利用了晶片的空間佈局,運算東西向水平移動,處理指令和資料的流動。資料在南北向讀取計算單元。無衝突設計:編譯器確保當MXM單元需要資料時,資料正好在那個時鐘周期通過"傳送帶"到達該位置。編譯器:Groq的真正大腦,架構中,編譯器承擔了所有繁重的工作。在NVIDIA架構中,硬體負責管理資料流(快取未命中,線程調度),計算出每個是在每個時刻的位置。晶片間互聯(C2C):為了讓幾百張卡像一張卡一樣工作,Groq晶片自帶了大量的Chip-to-Chip 引腳,晶片之間直接相連,不需要昂貴的InfiniBand 交換機或 NVLink交換機。對這一部分感興趣的讀者,可以留言點贊,後續再詳細講解。 (AI頓悟湧現時)
Fortune雜誌─OpenAI企業版銷售利潤率提升
2025年2月3日,在日本東京舉辦的“人工智慧推動業務轉型”活動中,OpenAI首席執行長薩姆·奧爾特曼(Sam Altman)與軟銀集團(SoftBank Group)首席執行長孫正義(Masayoshi Son)展開對話。圖片來源:Tomohiro Ohsumi—Getty Images據科技媒體The Information報導,為保持其在人工智慧領域的領先地位,OpenAI今年已成功提升其付費產品的利潤率。報導指出,OpenAI提升了其“算力利潤率”——該內部指標用於衡量扣除企業版與個人付費使用者模型運行成本後的收入佔比。報導援引知情人士稱,截至今年10月,OpenAI的算力利潤率已達70%,高於2024年底的52%,較2024年1月的水平翻了一番。OpenAI發言人回應稱,公司未公開相關資料,且不予進一步置評。OpenAI高管竭力應對AI支出擔憂作為ChatGPT的創造者,OpenAI雖引爆了本輪AI熱潮,卻尚未實現盈利——這對擔憂行業泡沫的投資者而言是關鍵指標之一。去年10月估值達5000億美元的OpenAI,一直在尋找盈利途徑以覆蓋高昂的算力成本,並支撐其宏大的基礎設施計畫。與此同時,公司正面臨支出壓力與競爭加劇的雙重挑戰。在Google(Google)旗下Gemini模型於多項基準測試中表現更優後,OpenAI首席執行長薩姆·奧爾特曼下達“紅色警報”,調動內部資源全力改進ChatGPT,並暫緩了廣告服務計畫的推進。目前大多數使用者仍使用ChatGPT免費版。但OpenAI正積極向金融、教育等行業推廣其企業版與付費軟體功能,從而與Google及競爭對手Anthropic展開較量。The Information報導稱,在付費帳戶的算力利潤率方面,OpenAI優於Anthropic,但後者在伺服器支出的整體效率上更高。OpenAI亦正與亞馬遜(Amazon.com Inc.)進行初期談判,計畫籌集至少100億美元資金並採用其晶片。若交易達成,奧爾特曼領導的這家公司估值有望突破5000億美元。(財富FORTUNE)
【十五五】重塑“視”界:AI視訊產業的戰略崛起與“十五五”發展藍圖
前   言如果說過去十年是移動網際網路重塑資訊傳播方式的十年,那麼站在“十五五”規劃開局之年的我們,正清晰地見證一場由人工智慧驅動的、更為深刻的視聽產業革命。AI視訊生成已從一個前沿概念,急速演進為驅動文化新質生產力、重構數字經濟版圖的核心引擎。從OpenAI的Sora引發全球驚嘆,到國內快手可靈、美圖等產品的快速商業化落地,再到《北京市促進“人工智慧+視聽”產業高品質發展行動方案(2025-2029年)》的率先出台,一個技術、政策與市場共振的產業發展“奇點”已然來臨。本文將深入剖析AI視訊產業的技術核心、市場動態、競爭格局與政策環境,勾勒其如何與國家“十五五”戰略同頻共振,賦能千行百業。一、頂層戰略與政策領航:為產業注入“確定性”任何顛覆性技術的規模化發展,都離不開清晰的國家戰略與穩健的政策框架護航。AI視訊產業正深度融入國家現代化宏偉藍圖,其發展軌跡獲得了強有力的頂層設計支援。國家層面的戰略定位極為明確。2025年9月發佈的《國務院關於深入實施“人工智慧+”行動的意見》(國發〔2025〕11號)是統領全域的綱領性檔案,不再將人工智慧視為孤立技術,而是定位為與經濟社會各領域深度融合、催生新質生產力的核心驅動力。檔案設定了清晰目標:到2027年,人工智慧將在六大重點領域深度應用,新一代智能終端、智能體等應用普及率超過70%;到2030年,人工智慧將全面賦能高品質發展,智能經濟成為重要增長極。這為AI視訊在各行各業的應用普及提供了明確的時間表和廣闊的想像空間。在“人工智慧+”的宏大敘事中,視聽產業因其巨大的文化影響力、經濟價值和民生關聯度,成為率先落地的關鍵領域。地方政府反應迅速,以北京市2025年11月發佈的“人工智慧+視聽PILOT領航計畫”為代表,堪稱一份前瞻性、系統性的產業發展路線圖。該計畫核心是“五位一體”的系統性推進:Platform(技術平台)攻堅垂類大模型;Innovation(內容創新)推動AI在影視、動畫等內容全鏈條應用;Landscape(場景賦能)覆蓋智慧影棚、文商旅體融合等領域;Optimization(服務最佳化)搭建智能體開發等平台;Trust(安全信任)探索“監管沙盒”,建構安全體系。這一方案標誌著發展思路已從單點技術突破,升級為建構技術、資料、平台、應用、安全協同進化的完整產業生態。圖表:國家及地方AI視訊產業核心政策時間軸資料來源:中投產業研究院整理圖表:北京市“人工智慧+視聽PILOT領航計畫”五維協同體系資料來源:政府機構官網、中投產業研究院二、技術突破與範式革命:從“工具”到“世界模型”的躍遷產業爆發的根源在於技術的代際飛躍。AI視訊生成技術在過去兩年完成了從“可用”到“好用”的關鍵跨越,其演進路徑清晰地指向對物理世界理解和模擬的更高維度。技術架構的演進是這場革命的基石。行業早期依賴生成對抗網路(GAN),隨後擴散模型(Diffusion Model)與Transformer架構的結合成為主流。當前,以OpenAI的Sora為代表的擴散型Transformer(DiT)架構成為前沿,它將Transformer的強大序列建模能力應用於擴散過程的潛在空間,從而能夠處理更複雜的時空關係。例如,Sora模型已能生成長達分鐘級、物理邏輯更一致的高品質視訊,這不僅是時長的延長,更是對場景動態合理性理解的質變。可以說,AI正在從“剪輯師”向“導演”進化。技術進步直接體現在產品性能的躍升和成本的陡降上。目前,頂級模型已能支援生成長達數分鐘的4K解析度視訊。更關鍵的是,成本優勢已成為顛覆傳統行業的“殺手鐧”。根據行業權威分析,目前國內外主流AI視訊生成API的單秒成本已降至0.2至1元人民幣區間。相比之下,傳統視訊製作成本呈幾何級數差異:本土電視廣告(TVC)視訊製作成本約在千元級/秒,而頂級動畫電影的製作成本甚至高達十萬元級/秒。這種千百倍的成本差異,為視訊內容的大規模、個性化生產掃清了經濟障礙。圖表:AI視訊生成技術演進路線圖資料來源:中投產業研究院圖表:AI視訊生成與傳統視訊製作成本對比柱狀圖資料來源:中投產業研究院三、市場爆發與競爭重塑:全球格局下的中國力量在技術與政策的雙輪驅動下,全球AI視訊市場正以驚人速度擴張,中國不僅成為最重要增長極之一,更在技術和商業化層面湧現出具有全球競爭力的參與者。全球市場規模與增長前景廣闊。根據Fortune Business Insights的預測,全球AI視訊生成器市場規模預計將從2025年的7.168億美元增長至2032年的25.629億美元,年複合增長率高達20%。亞太地區是增長最快市場,年複合增長率預計達23.8%,中國是主要驅動力。市場增長的底層動力是視訊在全球數字內容消費中佔據主導地位(據Cisco VNI預測,視訊已佔全球移動網際網路流量的70%以上)以及AI帶來的生產效率革命。競爭格局呈現多元化態勢,中國力量表現亮眼。海外廠商如Runway、OpenAI (Sora)在技術和創意社區影響力方面領先。據報導,Runway在2024年12月的年度經常性收入已達8400萬美元,顯示出強勁的商業化勢頭。與此同時,中國廠商如快手可靈(Kling)、美圖、字節跳動的剪映即夢等產品已躋身全球第一梯隊。在商業化上,中國廠商展現出更快速度和更靈活策略。例如,快手可靈(Kling)在2025年初實現了顯著的商業突破,年化收入運行率迅速攀升,凸顯出國內市場的巨大潛力和強大的商業化能力。此外,國內產品通常具有更優的性價比,降低了使用門檻,加速了技術在中小企業和個人創作者中的普及。圖表:全球AI視訊生成器市場規模預測折線圖(2025-2032)資料來源:Fortune Business Insights、中投產業研究院圖表:全球主要AI視訊模型性能與商業化對比氣泡圖資料來源:麥肯錫、BCG、中投產業研究院四、應用賦能與產業融合:催生“智能原生”新業態AI視訊技術的真正價值在於其作為“基礎能力”與千行百業融合後催生的“化學反應”,正在重塑從內容創作到產業營運的完整價值鏈。首先是內容產業自身的工業化升級。 AI已能深度參與劇本構思、分鏡生成、視訊生成與剪輯的全流程。這催生了如“AI漫劇”等新形態——以漫畫或小說IP為基礎,通過AI快速生成統一風格的動態短影片,極大縮短了IP視覺化周期。對於影視動漫行業,這意味著能夠以更低成本、更高效率進行“大規模個性化內容生產”。其次是賦能實體經濟,創造沉浸式體驗與增長新動能。在電商與零售領域,AI生成的個性化商品展示視訊能顯著提升轉化率。據Adobe Digital Insights報告,採用高品質視訊素材的電商頁面點選率可比圖文高出30%以上。在文旅與教育領域,通過AIGC技術對文物古蹟進行活化宣傳,可以打造沉浸式歷史文化體驗。在工業與科研領域,AI生成的高擬真視訊可用於自動駕駛演算法訓練和科學可視化,加速創新處理程序。最終,所有應用將匯聚於“智能終端”的革新。未來的AI電視、AI手機、AI眼鏡乃至智能汽車,將不再是簡單的播放裝置,而是具備本地化即時生成、理解和互動視訊內容能力的“智能體”。圖表:AI視訊在重點行業應用效果對比圖資料來源:中投產業研究院圖表:AI視訊賦能產業生態全景圖資料來源:中投產業研究院五、未來挑戰與核心關切:在創新與治理中尋求平衡前景雖廣闊,但邁向成熟的產業必須清醒應對挑戰。這些是“十五五”期間政策與產業界需共同攻克的核心議題。技術瓶頸與工程化鴻溝依然存在。當前AI生成視訊在複雜敘事邏輯、長程時序一致性上仍存不足,從生成單段視訊到支撐完整工業化工作流,仍需大量工程化創新。資料、算力與成本約束是產業可持續發展的關鍵。高品質、合規的視聽資料集建設挑戰巨大,同時大模型對智能算力的需求持續攀升。版權、倫理與安全風險是監管與產業發展的核心交匯點。 AI生成內容的智慧財產權歸屬、深度偽造技術濫用等風險亟待規範。北京方案中提出的“監管沙盒”機制正是前瞻性佈局。此外,既懂AI演算法又精通視聽藝術的複合型“智匠”人才短缺,也制約著產業發展。總而言之,AI視訊產業已告別野蠻生長期,步入與國家級戰略深度融合、在規範中加速創新的新階段。中國的獨特優勢在於統一的頂層戰略、豐富的應用場景、快速迭代的工程化能力以及積極審慎的治理框架。抓住這一機遇,不僅能培育兆級智能經濟新增長極,更將在建構數字時代文化軟實力和國際競爭新優勢中,佔據戰略制高點。這場由AI掀起的視覺革命,畫卷剛剛展開,其波瀾壯闊的未來,正待我們共同書寫。 (中投未來產業研究中心)
奧特曼的“帝國隱憂”:多線擴張,正在拖慢ChatGPT
過去一年,一個令人費解的現像在OpenAI內部蔓延:即便ChatGPT推出了能在國際數學奧賽摘金、在頂級程式設計競賽奪冠的“最強大腦”,但普通使用者們似乎並不買帳。圖片由AI工具生成據外媒報導和OpenAI 9月發佈的資料顯示,多數使用者使用ChatGPT可能只是詢問相當簡單的問題,根本無需動用那些耗費巨大計算資源、需要“思考”半分鐘的推理模型。這一刺眼的資料,指向了OpenAI在巔峰之下隱藏的深刻危機:一場由CEO山姆·奧特曼親自推動的戰略擴張正引發嚴重的深層危機,包括組織架構割裂、多線作戰導致資源分散,以及技術路線與使用者需求嚴重脫節,這正將其王牌產品ChatGPT拖入競爭泥潭。01核心矛盾:前沿研究與大眾需求的“性能過剩”鴻溝OpenAI的核心矛盾,根植於其研究部門與產品團隊日益擴大的目標分歧。公司內部一個超過千人、相對獨立的研究團隊,近年來將重心押注在追求“推理模型”和“通用人工智慧”(AGI)這一終極目標上。這種模型雖然能在複雜數學和科學問題上表現出色,但其代價是高昂的計算成本和緩慢的響應速度,處理一個問題可能需要數秒甚至數分鐘。然而,這與ChatGPT數億主流使用者的需求嚴重脫節。AI評估機構LMArena負責人彼得·戈斯特夫所言,“OpenAI 把重心放在‘科學、數學基準測試、前沿數學、程式設計競賽’上,但這似乎並不匹配典型的 ChatGPT 使用者”,他指出,“大多數 ChatGPT 使用者問的可能只是一些非常簡單的問題,比如電影評分、日常諮詢,“根本不需要模型思考半個小時”。這種“性能過剩”直接導致了產品層面的挫折。2025年初,當OpenAI試圖將最先進的推理模型轉化為ChatGPT可用的版本時,其性能反而“意外地變差”了。即使後來以“思考模式”等形式嵌入,在近9億周活躍使用者中,也僅有極少數人頻繁使用。更令人尷尬的是,OpenAI內部發現,就連傳統的非推理模型,在整合到ChatGPT產品時,也可能因與“個性化”等功能的衝突而導致性能下降。圖:從左到右依次為OpenAI應用部門CEO菲吉·西莫、CEO奧特曼以及首席研究官馬克· 陳02多線作戰:奧特曼的“帝國野心”與ChatGPT的資源內耗在核心產品面臨使用者體驗鴻溝的同時,奧特曼卻開啟了一場令人眼花繚亂的“多線作戰”。在ChatGPT之外,他同時推進了包括Sora視訊生成、音樂AI、AI網頁瀏覽器、AI智能體、消費級硬體裝置、機器人等一系列雄心勃勃的項目。這些平行推進的新項目,持續分流了原本應集中投入在 ChatGPT 上的關鍵資源。多位 OpenAI 研究人員證實,一些新方向的展開,客觀上削弱了用於提升 ChatGPT 大眾化吸引力的投入強度。結果出現了一個頗具諷刺意味的局面:在外部競爭愈發激烈的同時,OpenAI 最核心的收入引擎,卻在內部資源博弈中逐漸“失血”。即便是負責應用與產品線的首席執行長菲吉·西莫,也不得不坦言,在 OpenAI,“產品本身並不是終點”。這家公司在文化與決策層面,依然深受“研究優先”的基因所主導。這種戰略分散在應對Google的兇猛反撲時顯得尤為危險。Google憑藉其龐大的產品生態(Gmail、Chrome、YouTube等數十億使用者入口),正在將AI能力無縫融入使用者已有的工作流中。 正如分析師所言,使用者轉向Gemini“不僅僅是因為它模型更好,而是發現這種能力已經融入一切”。相比之下,ChatGPT在很大程度上仍是一個需要使用者主動訪問的獨立工具,面臨巨大的使用者習慣遷移成本。OpenAI在圖像生成功能上的搖擺,是內部戰略不協調的縮影。2025年早些時候,公司一度降低了圖像生成的優先順序,直到8月Google發佈引爆流行的Nano Banana圖像生成器後,才倉促重新聚焦。據員工透露,這甚至引發了奧特曼與研究主管馬克·陳之間的分歧。這種“追趕式”反應,暴露了多線作戰導致的決策滯後和被動。03增長悖論:使用者增速放緩與商業變現的競賽OpenAI正面臨一個關鍵的增長拐點。該公司在年初設定了年內達到10億周活躍使用者的宏大目標,但截至12月初,其使用者數“不足9億”,且顯示其使用者增長正在顯著放緩。然而,與使用者增長放緩形成鮮明對比的是,OpenAI在商業化變現方面取得了驚人進展。其年化收入從1月份的60億美元激增至目前的超過190億美元,主要動力來源於個人和企業使用者的訂閱。這一財務表現使其有望實現8月份設定的年底200億美元年化收入的目標,並超越其2025年130億美元的收入預期。基於此,該公司正尋求以7500億美元的估值進行融資,該估值較兩個月前高出50%。圖:在每100名ChatGPT的周活躍使用者中,約有5人付費訂閱其Pro或Plus服務不過,要實現OpenAI為2030年規劃的2000億美元收入願景,該公司必須將周活躍使用者轉化為日活躍使用者,以創造更多變現機會。這包括銷售計畫中的廣告,或從聊天機器人促成的交易中抽成。圖:OpenAI預計2030年收入將達到2000億美元儘管OpenAI發言人稱ChatGPT已佔據全球助手使用量的約70%,並成為蘋果應用程式商店年度下載量最大的免費應用,但其增長模式已顯現出深層矛盾:商業化成功可能以使用者增長放緩為代價。專注於從現有使用者獲取高額訂閱收入的策略,可能正在損害其使用者基礎的進一步擴大。並且,隨著GoogleGemini等競爭對手在使用者規模和生態整合上快速推進,OpenAI若不能有效解決使用者增長停滯的問題,其短期亮眼的財務資料背後,可能隱藏著觸及市場天花板的長遠危機。04競爭圍剿:Google的反擊與生態劣勢關於ChatGPT能否取代Google搜尋,當前的看法與一兩年前的主流預期已形成鮮明對比。當時,無論是OpenAI還是Google的高管都曾相信,ChatGPT能夠有效替代傳統搜尋引擎。然而,此後Google迅速在搜尋結果頂部整合了AI生成的答案摘要。據該公司2023年10月報告,這一功能正在推動“有意義”的搜尋量增長和收入提升,因為“使用者逐漸意識到,Google能夠解答更多類型的問題”。Google在其他方面的反擊也足夠精準和致命。2025年,其Gemini實現了快速增長:月活使用者從7月的4.5億增至6.5億,網站存取量單月增長14.3%,而ChatGPT同期訪問量卻連續兩月下降。更關鍵的是,Gemini的平均訪問時長自9月起已超越ChatGPT。Google的成功不僅源於模型性能。其Nano Banana Pro圖像生成器因能生成“可讀且上下文相符的文字”而風靡社交網路,而Gemini 3在複雜商業問題、寫作和編碼上的表現贏得了廣泛讚譽。分析師指出,使用者轉向Gemini“不僅僅是因為模型更好,而是發現這種能力已經融入一切”。圖:Google模型Nano Banana生成的圖片相比之下,OpenAI的生態劣勢明顯。前員工警告,如果Google在原始性能上實現超越,甚至免費提供Gemini,可能同時扼殺OpenAI的API和消費者訂閱業務。OpenAI雖然通過迪士尼合作和聘請蘋果前設計主管喬尼·艾維來建構生態,但硬體裝置“兩年內”才能面市,時間窗口正在縮小。05下一次“紅色警報”或撞上蘋果面對危機,奧特曼在12月拉響了“紅色程式碼”警報。他明確要求將資源重新集中到ChatGPT及其推理能力等核心基礎之上,並推遲了廣告、擴展電商等短期盈利項目。他希望在明年1月底通過一次重大產品更新來扭轉局面。與此同時,OpenAI還迅速推出了一系列應對措施:發佈GPT-5.2(內部代號Garlic),重新奪回多項AI模型性能基準榜首推出新圖像生成模型,回應GoogleNano Banana的競爭回退模型路由系統,讓免費使用者默認使用更快的GPT-5.2 Instant然而,這些措施暴露了更深層的問題。模型路由系統僅運行四個月就被撤回,因為它將免費使用者使用推理模型的比例從不到1%提升至7%,顯著增加了成本,卻因響應慢“對日活指標產生負面影響”。這再次證明,純粹的技術升級未必帶來產品成功。事實上,這並非OpenAI首次拉響“紅色程式碼”警報。首席研究官馬克·陳透露,該公司曾多次使用這一機制,但此次持續時間八周,是“比以往更長”的緊急狀態。此前,該機制曾被用於應對從DeepSeek到Anthropic發佈Claude等競爭威脅。然而,奧特曼的雄心意味著,未來公司可能還將面臨更多需要拉響警報的時刻。當前為期八周的“紅色程式碼”聚焦於應對Google的競爭,但這可能只是更大規模產業衝突的前奏。在鞏固軟體與模型優勢的同時,奧特曼已開始佈局一個更為宏大的硬體戰略,這預示著OpenAI可能與另一個消費電子巨頭蘋果發生直接碰撞。奧特曼對硬體裝置在AI普及中的關鍵作用深信不疑。他公開設定了一個極具顛覆性的目標:開發一款OpenAI裝置,以取代智慧型手機成為人們隨身攜帶的新標準。為實現這一願景,今年5月,他聘請了前蘋果設計靈魂人物喬尼·艾維,並收購了其初創公司,旨在共同打造新一代AI硬體。可以預見,正如Google在軟體層面對OpenAI發起猛烈反擊,蘋果也絕不會在它視為核心的硬體領域坐視挑戰者的崛起。這場即將到來的硬體之爭,將不僅是產品功能的比拚,更是關於下一代人機互動範式的話語權爭奪。06未來迷局:一場尚未結束的生存戰除了技術和產品性能外,OpenAI還面臨著其他方面的挑戰:在財務方面,儘管OpenAI預計其年化收入超過190億美元,但公司正“每年燒掉數十億美元現金”以支付驚人的計算成本。其規劃的1.4兆美元基礎設施投入更是天文數字,迫切需要ChatGPT創造更大、更穩定的現金流。在生態領域,與Google、微軟、蘋果等擁有成熟軟硬體生態的巨頭相比,OpenAI本質上仍是一家“模型公司”。它正試圖通過與迪士尼合作、聘請蘋果前設計主管開發硬體來建構生態,但這需要時間,而競爭對手不會等待。在利潤豐厚的企業客戶市場,OpenAI 似乎也失去了更多市場份額,根據Menlo Ventures近期的一份報告,其份額已降至27%,而Gemini則上升至21%,Anthropic以 40%的份額領先。復盤OpenAI的戰略,其癥結在於:在憑藉技術閃電戰取得先發優勢後,未能將技術優勢高效、專注地轉化為可持續的產品優勢和使用者體驗護城河。 奧特曼同時追逐AGI、硬體夢想和多元產品生態,導致公司在關鍵戰役上兵力分散。而追求極致的“推理”性能,又與大眾市場對“即時、可靠、易用”的核心需求產生了錯配,陷入了“性能過剩”的陷阱。“紅色程式碼”是一次緊急止血和戰略回呼,但ChatGPT的泥潭之路尚未走完。OpenAI需要回答的根本問題是:它究竟是一家以AGI研究為終極使命的實驗室,還是一家以贏得AI產品市場為目標的公司?這道題的答案,將決定它是否能穿越巨頭圍剿的硝煙,守住自己開創的時代。正如矽谷歷史的教訓所昭示的,創新者與老牌巨頭的戰爭,往往贏家通吃,而輸家則只能成為史書中的一個腳註。OpenAI正站在這樣一個決定命運的岔路口。 (騰訊科技)
奧爾特曼點名“AI記憶”,儲存環節迎來新敘事
奧爾特曼表示,“雖然說這是2026年(要考慮)的事,但它是我個人最期待的部分之一。”“這是整個系統裡我個人最期待的部分之一。”在日前的Big Technology訪談中,OpenAI CEO山姆•奧爾特曼(Sam Altman)如此形容記憶功能。在他看來,AI的下一個重大飛躍並非是更敏銳的推理能力,而是更為根本的記憶。ChatGPT問世三年多以來,聊天介面並沒有出現大變動,但底層功能進步不少,其中就包括記憶功能。在訪談中,當被問及“記憶功能究竟發展到什麼程度”時,奧爾特曼表示,“其實我認為我們現在完全無法想像它最終能發展到什麼程度。人類本身是有侷限的:即使你擁有世界上最好的私人助理,他們也不可能記住你說過的每一句話,不可能讀過你的每一封郵件,不可能看過你寫的每一份檔案,不可能每天觀察你的所有工作並記住每一個細節,也不可能以那樣的深度參與到你的生活中——沒有任何人類擁有完美無限的記憶,但AI肯定可以做到這些。”記憶功能是OpenAI內部經常討論的一個問題。目前ChatGPT雖然迭代到了5.2,但記憶功能“依然非常粗糙、非常早期”,仍處於“GPT-2時代”。一旦AI真的能記住你整個人生的每一個細節,並在此基礎上加以個性化——不僅能記住事實,還能察覺、捕捉並利用那些連使用者自己都沒意識到未曾刻意表達過的小偏好,AI將變得極其強大。“我覺得這是一個非常令人興奮的方向。雖然說這是2026年(要考慮)的事,但它是整個系統中我個人最期待的部分之一。”奧爾特曼直言。▌KV Cache重要性凸顯此前,OpenAI已於2024年2月啟動記憶功能小範圍測試,並於2025年4月升級為可參考全部歷史對話的長期記憶系統,能跨對話保留使用者偏好、工作內容與常用格式,在互動中持續呼叫,顯著強化個性化服務與使用者黏性。可以看到,在奧爾特曼的描述遠景中,擁有了成熟記憶能力的ChatGPT堪稱“開了掛的超級個人AI Agent”。根據《Heterogeneous Memory Opportunity with Agentic AI and Memory Centric Computing》(Jinin So),建構一個強大的“Agentic AI”,因為自注意力機制需要對序列中的每個元素(token)與序列中所有其他元素之間的關係進行建模,因此對記憶體和儲存系統提出了前所未有的、多層次的需求和挑戰。AI記憶系統可以被劃分為工作記憶(處理當前任務)和長期記憶(知識、技能、經驗)。程序性記憶(模型本身):隨著大語言模型參數量的增長,其自身大小已達到TB等級;語義記憶(外部知識庫):儲存外部知識的向量資料庫,其容量需求可達數十TB;工作記憶(執行階段快取):在高並行推理時,僅KV快取(KV Cache)一項就能消耗上百TB的記憶體。整個系統融合了大模型(如Gemini)、外部資料庫(如Milvus)和快取記憶體機制,並通過檢索、學習等方式進行互動,這對資料流動的頻寬和延遲提出了極高要求。其中,“能記住使用者說過的所有話、讀完所有郵件和文件、深度全量參與使用者生活”的AI,需要的正是“工作記憶”。廣發證券指出,AI的“工作記憶”在技術上體現為大模型的“上下文窗口”,它是AI進行複雜、多步推理和決策的工作台與基礎。它的核心功能是整合所有相關資訊以支援連貫思考。通過將系統指令、歷史對話、使用者問題、外部知識(來自語義記憶)和模型的中間思路全部“盡收眼底”,大模型才能進行全面、有深度的推理,而不是孤立地看問題。國金證券稱,目前隨著大模型應用的普及和上下文窗口的不斷擴展,KV Cache技術的重要性將進一步凸顯。無論是ChatGPT的流暢對話體驗,還是Claude的長文件處理能力,都需要KV Cache的技術支撐。未來KV Cache將在智能化、硬體加速、邊緣部署等方向持續演進,為更廣泛的AI應用提供強有力的技術支撐。智能化與硬體化趨勢明確,KV Cache有望在未來數年持續提升大模型推理效率並改善算力成本結構。落實到具體方向上,東方證券認為,儲存供不應求持續,同時海外儲存巨頭在通用儲存方面的擴產進度可能有限,建議關注國內半導體裝置企業中微公司、京儀裝備、微導奈米、拓荊科技、北方華創等;佈局端側AI儲存方案的兆易創新、北京君正等;受益儲存技術迭代的瀾起科技、聯芸科技等;國產企業級SSD及儲存方案廠商江波龍、德明利、佰維儲存等。 (科創板日報)
在Polymarket上押注“OpenAI發佈新模型”,預測市場再陷內幕交易危機
Polymarket押注OpenAI與Google,引發內幕交易嫌疑。過去一周,預測平台Polymarket上少數帳戶押注OpenAI將在12月13日前發佈新的大語言模型。12月11日,OpenAI正式推出GPT-5.2,使得其中四個帳戶累計獲利超1.3萬美元。這使外界更加懷疑,Polymarket和Kalshi等預測平台上的部分帳戶並非單純走運——它們可能接觸到了Google、OpenAI等公司的內部資訊,或者其持有者就是這些公司的員工。預測市場迅猛發展隨著(允許使用者小額投注的)預測平台熱度飆升,越來越多公司開始修訂長期禁止員工利用機密資訊交易股票的政策,將其納入了監管範圍。畢馬威合夥人康威·道奇表示,過去半年裡,他與企業客戶討論是否應將內幕交易政策覆蓋預測市場的次數至少翻了一番。“這可能是金融機構及其他客戶需要開始思考的下一個問題。”加密貨幣和股票交易應用已意識到這一風險。Robinhood已更新了內幕交易政策,將預測市場納入監管範圍。加密貨幣交易所Coinbase發言人聲明稱,Robinhood數月前已進一步擴展政策條款,“禁止員工(包括高管)參與預測市場”。Robinhood營運了自有預測市場,Coinbase計畫下周推出預測服務。OpenAI與Anthropic則表示,其政策會明確禁止員工利用機密資訊謀取私利(包括預測平台)——但政策何時調整或是否調整尚不明確。企業對員工使用預測平台的關注度提升,源於去年Kalshi和Polymarket活動的激增——當時大量使用者湧入押注美國2024年總統大選。這兩個平台允許使用者以不到1美元的價格購買事件合約(即會向正確預測事件結果的投資者支付收益的衍生品)。使用者需預先支付合約費用,若預測正確即可收回本金並獲得利潤。用Kalshi聯合創始人的話說,這種“對任何分歧觀點”的靈活押注模式使預測市場大受歡迎。加密資料提供商Artemis Analytics的資料顯示,Kalshi平台(宣稱受商品期貨交易委員會監管)的交易量在過去半年激增約五倍,最近一周日均交易額達1.83億美元。今年9月,Polymarket宣佈CFTC已批准其再次服務美國使用者(三年前CFTC曾禁止其接受美國使用者交易)。目前Polymarket交易量激增超六倍,日均達1.97億美元。投資者正以越來越高的估值爭相支援這些公司。內幕交易“法外之地”?隨著AI日益成為公眾關注焦點,這些平台開始日益增加與科技產品發佈相關(通常不被傳統博彩網站覆蓋)的投注選項。例如Kalshi的使用者可押注設計師喬尼·艾維正在為OpenAI研發一款“夾戴式裝置”(支付48美分)或“頭戴式顯示器”(支付23美分)。若事件成真,合約價值將升至1美元。然而人們發現,部分使用者似乎擁有"預知能力",會在科技企業發佈公告前反覆對其大額押注——這加劇了人們對獲勝者來自該企業內部的懷疑。上周,Polymarket平台某帳戶通過精準押注Google2025年搜尋資料,單日獲利超百萬美元——這一表現讓人懷疑該帳戶背後是Google內部人士。目前Google發言人拒絕回應公司是否制定了禁止在預測市場進行內幕交易的規定。美國證券法禁止利用“重大非公開資訊”進行交易。但由於預測市場合約不屬於證券範疇,美國證券交易委員會(SEC)對其不具有監管權,需由監管期貨交易的商品期貨交易委員會(CFTC)或司法部負責處理。不過,利用機密資訊在預測市場牟利可能違反員工對僱主的法律義務。米爾班克律師事務所企業治理與證券法專家喬治·卡內洛斯指出:“這相當於一種欺詐行為,類似於貪污,因為你暗中利用資訊謀取私利。”周四,包括Kalshi和Coinbase在內的多家企業宣佈成立新行業組織,倡導接受聯邦監管而非州級監管,首先聚焦制定全國性反內幕交易標準。但複雜之處在於,企業高層有時會暗示員工應有權對自家公司活動進行押注。例如Coinbase CEO布萊恩·阿姆斯特朗近日被問及是否應允許預測市場存在內幕交易。他在《紐約時報》DealBook峰會上回應稱此事“並非黑白分明”。他舉例說,若人們想知道蘇伊士運河何時重開,允許運河上艦船的艦長參與押注會使市場預測更準確;但另一方面“又希望維護這些市場的誠信度”。事實上,包括Google和Anthropic在內的部分企業已建立內部預測市場。員工可通過虛擬貨幣對諸如團隊何時完成項目等議題進行投注。Google現行預測市場的建立者、預測網站Metaculus的CTO丹·施瓦茨指出,此類市場預測僅在公司內部,不會損害企業利益。他認為,這類內部預測與其說是在遏制內幕交易,不如說是在“鼓勵內幕交易”,“其核心在於促使員工主動披露所掌握的資訊”。 (創新觀察局)
孫正義豁出去了!賣光輝達、抵押Arm也要注資OpenAI
據媒體報導,有消息人士透露,日本軟銀集團(Softbank)正四處籌款,力爭年底前完成對OpenAI注資225億美元承諾。消息人士指,軟銀集團計畫通過一系列融資方案籌集所需資金,包括出售部分投資,並可能動用以其晶片公司Arm Holdings(ARM)股份作抵押的保證金貸款。為了募資,軟銀已經悉數出售手上價值58億美元的輝達(NVIDIA)股份,減持價值48億美元的T-Mobile(TMUS)股份,並大幅裁員。兩名消息人士指,孫正義已經將軟銀願景基金的大部分交易速度減慢到極致,任何超過5000萬美元的交易均需得到他的明確批准。軟銀正著力推動支付應用PayPay上市,原定於本月進行的IPO因美國政府長達43天的停擺而被推遲,根據兩位知情人士透露,PayPay預計將在明年第一季上市,料募資超過200億美元的資金。另外,有一位知情人士透露,軟銀計畫出售部分內地網約車平台滴滴全球,滴滴2021年從美國退市後,曾宣佈尋求在香港上市。消息人士稱,OpenAI尚未收到剩餘資金,但預計資金將於2025年底前到位。消息人士稱,軟銀可以利用多種資金來源,包括保證金貸款、資產負債表上的現金、上市公司的股份、以及公司債或過橋貸款。軟銀今年4月達成協議,以3000億美元的估值投資OpenAI。消息人士補充說,自那以後,OpenAI的估值大幅上漲,該公司正在與包括亞馬遜在內的投資者洽談額外融資,這將使其估值翻三倍,接近9,000億美元。一旦交易完成,軟銀將獲得可觀的帳面收益。軟銀的主要資金來源之一是其以英國半導體公司Arm Holdings的股權為抵押獲得的未提取保證金貸款,軟銀近期將保證金貸款額度增加了65億美元,使未提取額度總額達到115億美元。 Arm的股價自IPO發行以來已上漲三倍,為軟銀提供額外的抵押空間,使其能夠擴大借貸規模。截至9月30日,軟銀集團公佈的母公司層級現金持有量為約271.6億美元,同時軟銀仍持有T-Mobile US約4%的股份,截至9月底,該股份價值約110億美元。 (北美商業見聞)
GoogleAI逆襲背後的頭號功臣
【新智元導讀】Google AI 在 2025 年下半年打了個漂亮的翻身仗,用 Nano Banana 和 Gemini 3 Pro 這兩款殺手級模型,從 OpenAI 手下搶走了大量使用者。背後的功臣,對內聲名顯赫,對外默默無聞。他是誰?他有著怎樣傳奇的故事?在Google最危險的時刻,一位不為外界熟知的中年人在內部臨危受命。他引領團隊開發出爆紅的AI應用,讓GoogleAI業務起死回生,甚至一度打敗 ChatGPT 登頂應用榜。他是誰?他的故事揭示了Google如何用創新和責任心,在 AI 競賽中重奪主動權。GoogleAI逆襲背後的「無名」功臣2025 年 8 月的一個深夜,Google資料中心的警報突然頻繁響起——伺服器負載飆升至前所未有的水平。工程師們開玩笑說,再這麼下去,他們特製的TPU晶片恐怕都要被燒化了。引發這一切的,是Google Gemini 應用中新上線的圖像生成功能「Nano Banana」。這個功能可以將多張照片融合成獨特的數字人偶,意外地在全球引爆了使用者熱情。短短幾天裡,海量使用者湧入嘗鮮,生成的圖片數量迅速突破數十億張,直接把Google的伺服器「烤」得冒煙。Google被迫緊急對 Nano Banana 的使用加以限制,以免後台基礎設施真的撐不住這股熱潮。然而,這場近乎「失控」的走紅非但沒有讓Google高層惱火,反而令整個公司為之振奮——Gemini應用終於一戰成名。在8月底功能推出後的短短一個月內,Gemini 累計生成圖像超過 50 億張,甚至一度超越 OpenAI 的 ChatGPT 躍居蘋果 App Store 下載榜首。而站在這一切背後的操盤手,正是一位在公司內部聲名顯赫,對外低調神秘的中年人:Josh Woodward。42 歲的 Josh Woodward 並非矽谷家喻戶曉的名字,但在Google內部,他幾乎是傳奇般的存在。這位出生於美國中部奧克拉荷馬州的產品經理,2009 年通過實習進入Google,從此一路在各種創新項目中嶄露頭角。早年間他曾參與建立Google最初幾代 Chromebook 筆記型電腦,聯合創立了面向新興市場使用者的「下一個十億使用者(NBU)」計畫,並主導了 Google Pay 支付服務的拓展。豐富的履歷和雷厲風行的作風,使他在內部備受推崇。正因如此,當Google在生成式AI領域感到空前的壓力時,管理層想到了 Woodward。2025 年 4 月,Google AI 戰線進行了一次關鍵人事調整:一直埋頭於實驗室業務的 Woodward 被提拔為 Gemini 應用負責人,接過公司AI戰略的帥印。當時,OpenAI 憑藉 ChatGPT 在 AI 領域風頭正勁,行業專家紛紛預言使用者將從傳統搜尋轉向AI應用。Google痛感自己的搜尋霸主地位受到威脅,加上母公司 Alphabet 一季度股價暴跌約兩成,亟需一場勝利來重振士氣。接任後的 Woodward 深知責任重大,他一手主管 Gemini 應用業務,同時仍領導著Google旗下的新興技術試驗田——Google Labs,肩負起在 AI 競賽中為Google開闢新賽道的雙重任務。「TPU 快被燒化了!」 AI爆款的誕生Woodward 上任後不久,就迎來了大顯身手的機會。這款名為 Gemini 的 AI 應用原本籍籍無名,卻因為一個名叫「Nano Banana」的新功能而聲名鵲起。Nano Banana 最初只是團隊的一次創意迭代:使用者可以上傳多張自己的照片,由AI將其合成為一個獨一無二的數字玩偶形象。沒想到這個充滿趣味的功能一推出就風靡全球,伺服器上一時間請求暴增。據Google AI 基礎架構負責人 Amin Vahdat 回憶:「我們的TPU晶片組當時幾乎要被烤化了!」。團隊不得不暫時為 Nano Banana 設定使用上限來緩解壓力。然而,這次「小危機」凸顯的正是巨大的機會:使用者對個性化AI創作的渴求超出了所有人的想像。Woodward 敏銳地意識到這正是 Gemini 突圍的契機。在他的推動下,團隊連夜擴容後台算力,全力保障這一功能的穩定運行。事實證明,這場硬體「險情」恰是 Gemini 騰飛的起點——到 9 月底,Gemini 應用累計生成的圖像已突破 50 億張。憑藉 Nano Banana 的爆紅,Gemini 應用的月活躍使用者從 3 月的 3.5 億飆升到 10 月的 6.5 億。更令Google揚眉吐氣的是,在 Nano Banana 帶動下,Gemini 在蘋果 App Store 的下載量一舉超越了 ChatGPT,登上免費應用榜冠軍。Google用了不到半年時間,就實現了從 AI 跟隨者到市場領跑者的驚人逆轉。Alphabet 公司的股票也隨之止跌回升,到年底累計上漲了 62%,成為當年美股中表現最亮眼的科技巨頭之一。這一切都令業界震動:Google似乎找回了久違的速度與激情,而推動公司完成這次AI領域「逆襲」的關鍵人物,正是 Woodward。對於 Gemini 的成功,Woodward 保持著難得的清醒與冷靜。他深知,在快速推進 AI 創新的同時,更需要慎重考慮技術可能帶來的負面影響。今年 11 月,Google發佈最新的大模型 Gemini 3,引發行業轟動。在接受媒體採訪時,Woodward 興奮地表示「我從來沒有像現在這樣覺得工作充滿樂趣」 ——AI 模型的強大能力讓各種天馬行空的產品創想成為可能。但身為掌舵者,他也時刻警惕著技術的雙刃劍。此前,他就在紅杉資本的播客節目中坦言,AI 的進步正處於一個足以「改變時代」的關鍵節點,這種改變「可能是向善的,也可能是適得其反的」。事實證明,Nano Banana 功能在爆紅的同時也一度引發爭議:有使用者使用它根據提示詞合成援非人道主義場景的形象時,生成的畫面卻是身著便服的白人女性周圍圍繞著非洲黑人兒童,引來種族刻板印象的批評。這類爭議讓 Woodward 更加意識到,AI 產品在追求創新的同時絕不能忽視社會責任。他要求團隊迅速最佳化演算法,避免再次出現類似偏見輸出,並強調任何 AI 新功能上線前都要經過更嚴格的審查。Google內部也在他的倡議下設立專門機制,評估熱門AI應用可能引發的道德和信任問題,力求在保持高速創新的同時守住「不會傷害使用者信任」的底線。Google在制定AI產品戰略時相當克制理性。Woodward和他的上級、DeepMind CEO 哈薩比斯(Demis Hassabis)商議後,有意避開了時下火熱但容易引發倫理爭議的「AI情感伴侶」方向,而是堅持將Gemini定位為提升工作效率的超級工具。Google內部給Gemini制定的考核指標並非使用者粘性或時長,而是每天幫助使用者完成了多少實際任務。這樣的取捨背後,是Woodward對於AI角色邊界的深思——AI最重要的價值應在於賦能人類,而非讓人沉迷於虛擬陪伴。當下,生成式AI正加速滲透進人們生活的方方面面,海量AI生成內容充斥網路,真偽難辨。Woodward比任何人都清楚,Google必須加倍謹慎,既要跑贏競賽,又不能因魯莽而丟掉使用者多年來對Google品牌的信任。因此,他在業務衝鋒的同時,以身作則地為團隊敲響警鐘:「我們正處在一個技術巨變的關口,這種變革將影響好幾代人。身處這個位置,我們必須確保它被用來促進善意,而非滋生危害。」敢想敢幹 「讓他們盡情去做」Gemini應用的成功並非偶然。事實上,Woodward上任之前就在Google內部孵化出多款頗具前景的AI產品。其中最出名的,當屬AI筆記助理NotebookLM。它最初只是Google Labs團隊一個默默無聞的試驗項目——資深產品經理Raiza Martin利用工作之餘的「20%時間」開發了一個名為Project Tailwind的原型:它可以讓使用者上傳文件、PDF甚至視訊,然後由AI提煉要點、生成摘要或見解。Woodward對這個創意一眼相中,大力支援團隊繼續打磨。為了把這個項目做成真正貼近使用者需求的產品,他大膽採取了一系列「非常規」舉措,打破了Google內部的慣例和層層壁壘。首先,Woodward從外部網羅來一位出人意料的「臨時盟友」——科技作家史蒂文·約翰遜(Steven Johnson)。Johnson在業界小有名氣,出版過多本暢銷書,卻從未在任何公司任職過。2022年,Woodward讀到Johnson關於AI與創意的文章後深受啟發,竟主動發出邀請,請他以訪問學者的身份加入Google Labs,共同探索如何用AI增強人類的創造力。對於這種「不按常理出牌」的合作模式,Woodward的想法很簡單:「讓四五個工程師和一個真正的作家碰在一起,看看會產生什麼火花」。在他的牽線下,Johnson開始兼職參與Project Tailwind,為團隊提供作家視角的輸入,分享職業寫作者整理資訊的工作流。工程師們在一旁觀察他的使用習慣,不斷改進產品功能。一段時間磨合後,Johnson深深投入其中,最後乾脆接受了Woodward的邀請轉為全職,擔任NotebookLM團隊的「創作總監」。這樣「破圈」的人才能夠加盟Google,靠的正是Woodward勇於創新用人的魄力。不僅如此,為了快速完善NotebookLM,Woodward還鼓勵團隊主動擁抱外部使用者社區的力量。在產品開發早期,團隊希望收集真實使用者的反饋來改進產品。按常規,Google內部有自己的論壇和郵件列表,可以用來做封閉測試。但年輕的產品經理Raiza更傾向於直接去主流社群與使用者互動,她選擇了當下開發者和AI愛好者云集的平台——Discord聊天伺服器。這在當時引起了一些內部爭議:畢竟Google一向偏好使用自家產品,很多高管甚至不知道Discord為何物。有管理人員質疑:「為什麼不用Google Meet會議或者內部群組?」對此,Woodward全力支援Raiza的提議。他乾脆對團隊撂下一句:「讓他們盡情去做吧(Let them cook)!」在他的力挺下,NotebookLM項目組順利搭建了Discord伺服器,與第一批種子使用者直接交流。這種開放姿態很快收穫了回報:借助社群力量,NotebookLM在打磨階段就吸引了大批AI發燒友的關注,產品不斷根據反饋迭代升級。到2024年底,該Discord社區已匯聚了超過20萬名成員,成為Google史上最活躍的產品使用者社區之一。很多團隊成員坦言,如果沒有Woodward頂住內部壓力允許他們「破例」用第三方平台,這款產品不可能進步得如此快、如此好。終於,2023年5月,Woodward帶著打磨成型的NotebookLM走上Google一年一度的I/O開發者大會舞台。在Google雲CEO托馬斯·庫裡安的主題演講結束後,Woodward出人意料地現身台上。他先是賣了個關子,向台下觀眾介紹說:「我們在幾周內用五名工程師拼出了一個新點子,叫作Project Tailwind。我自己的母校俄克拉荷馬大學師生也參與了內測。大家想看看它能做什麼嗎?」隨後,他現場操作筆記應用,匯入幾篇文件。不出幾秒,螢幕側欄便自動生成了這些材料的關鍵詞和延伸提問。他隨手點開「引用來源」按鈕,興奮地介紹道:「這個功能是我最喜歡的——AI會標註出每條答案背後的出處。 」短短幾分鐘的演示贏得滿堂喝彩。NotebookLM就此進入公眾視野,並在隨後數月向廣大使用者開放試用,上線不久便廣獲好評。Google很快為其加入了支援音訊、視訊內容的分析功能,讓這款AI筆記助手更趨完善。NotebookLM的成功不僅證明了Woodward識人用人的獨到,也驗證了他推動內部「減小阻力」所取得的成效。在官僚體系龐大的Google公司,許多創新想法往往困於流程冗長、部門掣肘。為此,Woodward在Google Labs內部設立了一個特別機制,員工如果遇到體制上的「絆腳石」可以提交一個代號為「Block」的工單,由專門團隊迅速協調資源排障。NotebookLM項目在籌備上線時一度面臨算力不足的問題,Woodward 便通過這一機制火速調撥了更多TPU算力支援,確保產品性能萬無一失。據團隊工程師回憶,有了「Block」系統的保駕護航,他們再也不用為內部審批耗費精力,可以心無旁騖地專注於產品研發。「有這樣一位負責人幫我們清理那些惱人的障礙,我們才能真正將精力放在使用者身上。」Google Labs 的一名軟體工程師 Usama 感嘆道。小細節,大作為Woodward 領導風格中另一個令人稱道的特點,是他對「細節決定成敗」的高度重視。擔任 Gemini 和 Google Labs 負責人後,他發起了一項名為「Papercuts」(紙割傷)的內部計畫,專門蒐集和快速修復那些雖然不至於致命、但影響使用者體驗的「小傷口」。在 Woodward 看來,這些細枝末節的改進往往最能打動使用者,卻常被大公司忽視。有使用者抱怨在 Gemini 聊天時無法中途切換大模型而不重新開始對話,Woodward 知道後立刻催促工程師最佳化。不久他就在自己的 X 帳號上驕傲地宣佈:「Papercut 已修復:現在你可以在 Gemini 應用的對話中途切換模型而無需重新啟動會話了。」這條動態下面,許多使用者紛紛留言點贊,感謝他傾聽並解決了困擾自己的「小問題」。事實上,親自聆聽使用者聲音、持續打磨產品細節,幾乎已經成為 Woodward 工作的日常。身為公司高管,他卻常常一頭紮進社交媒體的一線陣地,在 X 和 Reddit 上直接回答使用者提問、收集吐槽反饋。業界人士形容這在科技巨頭中相當少見——一位負責核心產品的副總裁竟然親自在論壇上當「客服」,甚至把使用者直言不諱的批評意見轉發給開發團隊要求改進。但在 Woodward 看來,這正是產品經理應有的擔當:「使用者願意花時間告訴我們問題出在那兒,那就是在幫我們變得更好。」NotebookLM 團隊一名前設計師 Jason 回憶,Woodward 經常帶著從使用者社區蒐集的反饋走進會議室,對大家說「看看,這是使用者真正關心的,我們能做點什麼?」Jason 由衷佩服地說:「這種對終端使用者的承諾和執著,我在其他領導身上幾乎沒見過。」Woodward 平易近人的人格魅力也在這些「小事」中展露無遺。同事們常提起他的一個招牌舉動:當有團隊成員因為線上評論的批評而情緒低落時,Woodward 會故作誇張地哈哈一笑,用他那帶著中西部口音的爽朗笑聲打趣道:「走,一起回覆網友去!」據說,沒有人能抗拒他這富有感染力的笑聲——緊張的氣氛瞬間就被他化解了。前同事 Caesar Sengupta 曾打趣地評價:「我從沒見他對誰發過火。」這位與 Woodward 共事多年的Google前高管甚至半開玩笑地放言:「照這樣下去,他早晚會成為Google的 CEO。」雖然只是戲言,但也從側面反映出 Woodward 在Google內部的威望和人望之高。從奧克拉荷馬小鎮少年 到Google中流砥柱在成為Google AI 戰略幕後英雄之前,Josh Woodward 的人生軌跡並非典型的「矽谷精英」路線。他 1983 年出生於美國奧克拉荷馬州一個普通家庭,自幼成長於埃德蒙德(Edmond)小鎮。從小勤奮好學的 Woodward 考入了家鄉的俄克拉荷馬大學主修經濟學,2006 年以優異成績畢業,並被評為年度傑出畢業生之一。大學期間,他對公共事務和全球視野表現出濃厚興趣,積極參加各類學生領導力項目。畢業後,他獲得獎學金遠赴英國牛津大學深造,攻讀比較政府學,並於 2009 年拿下碩士學位。在牛津,他把研究重點放在美國軍事及經濟援助對外國民主處理程序的影響上——這一少有人問津的題目透露出他對「科技與社會」「力量與責任」等宏大命題的早期思考。也許正因如此,當他回到美國踏入科技行業時,能始終從更長遠的角度審視手中的技術。2009 年,Woodward 以產品管理實習生的身份加入Google,很快顯露出過人的敏銳和領導才能。他樂於接受具有挑戰性的任務,勇於從零開始打造新項目。在Google工作最初十年裡,他涉足多個前沿領域,從硬體裝置到新興市場,無不留下自己的印記:他參與了 Chrome 作業系統和首批 Chromebook 筆記本的開發;自告奮勇加入公司新成立的「NBU」計畫,去研究和服務印度等地第一次觸網的海量使用者,並因此被視為NBU項目的奠基人之一;後來又接手 Google Pay 的國際化拓展業務,為數億使用者帶去便捷的移動支付體驗。這些橫跨軟硬體、全球市場的經歷,讓 Woodward 對「如何讓技術普惠大眾」有了深刻理解。這種理念也貫穿在他之後負責的AI產品中——無論是 NotebookLM 還是 Gemini,他始終強調的是為使用者創造真正有用的價值,而不僅是炫技式的噱頭。Woodward 還有一個鮮明的個人標籤:酷愛閱讀且樂於分享。熟悉他的人都知道,他的辦公室和家中總是堆滿書籍,從商業傳記到科幻小說無所不讀。據說Google高管層每每想找本好書讀時,第一個諮詢的對象就是 Woodward。他至今堅持寫閱讀筆記,早年在 NBU 團隊時便每周編輯一封內部通訊,內容簡潔而發人深省,當時這封通訊在Google內部意外走紅,許多人聞訊後紛紛來信請求訂閱。如今儘管工作繁忙,他仍保持著每季度給團隊和朋友們寫一封「Josh 通訊」的習慣,分享自己近期讀到的有趣見解。身邊同事戲稱他是Google的「行走書單」。更難能可貴的是,Woodward 不僅博覽群書,還善於將知識活用於工作決策中。據前文提到的 Raiza 回憶,在 NotebookLM 項目開發過程中,Woodward 曾特地發給她一篇論文,探討使用者究竟能否信任AI聊天機器人的答案。這讓 Raiza 意識到,領導關心的不僅是產品功能實現,更是產品能否真正贏得使用者信任。類似的故事不勝列舉——他會建議團隊工程師閱讀科幻小說,從中獲得對未來技術的想像力;也會邀請人文學者來交流,提醒大家科技創新不能脫離人文關懷。這些細節都體現出 Woodward 作為領導者的深度與溫度。變革時代的掌舵者2025 年行將結束之際,Google憑藉在AI領域的一連串突破重新煥發了生機:從 Gemini 3 模型的橫空出世,到一個又一個「現象級」應用的推出,整個公司一掃年初的低迷,士氣高漲。CEO 桑達爾·皮查伊(Sundar Pichai)在全員大會上興奮地表示:「過去這一年的進展真是令人難以置信——Google各個團隊都在以前所未有的速度推出新功能。」而站在這股 AI 浪潮中央、備受矚目的,正是 Josh Woodward 和他所率領的團隊。展望 2026 年,業界對Google寄予厚望,期待這家科技巨頭繼續以 Responsible AI(負責任的人工智慧)的姿態領跑。在聚光燈之外,Woodward 依然埋頭忙碌著:既要帶領兩個部門創新競速,又要謹慎把關每一項技術的潛在影響。然而,這位久經考驗的「Google AI 掌櫃」臉上沒有焦慮,有的只是對未來的堅定信心和一絲藏不住的興奮。在最近的一次採訪中,當被問及如此高壓的工作如何堅持時,他爽朗一笑:「因為從未像現在這樣好玩啊!」對於熱愛挑戰的他來說,這或許正是真正的樂趣所在——身處巨變浪潮之巔,以初心為舵,划槳向前,讓技術的光芒照亮而非灼傷這個世界。 (新智元)