#Chatgpt
康州男與ChatGPT長聊數月後弒母
(華人今日網)美國聊天機械人ChatGPT被指控與康乃迪克(Connecticut)一起母子死亡案有關,死者的遺產律師已對ChatGPT母公司OpenAI與投資方微軟(Microsoft)提起訴訟。這起案件成為微軟因為AI機器人導致過失致死而挨告的訴訟首例。索爾伯格(左為幼年與祖母合照)指責ChatGPT致父殺祖母並自殺。 (圖片來源:華爾街日報)今年8月,居住在康州格林威治(Greenwich)的男子索爾伯格(Stein-Erik Soelberg,56歲)殺害與他同住的母親亞當斯(Suzanne Adams,83歲)後自殺身亡。根據起訴書,索爾伯格在死前數月一直在與ChatGPT交談,表達自己對於受到監視,恐遭人暗殺的擔憂;這些交談內容使索爾伯格相信,他讓ChatGPT「獲得了意識」,而自己的頸部和大腦被植入了與一項「神聖使命」有關的裝置。起訴書寫道:「ChatGPT……不斷強化並放大他每一個新的偏執信念,系統性地將他身邊最親近的人——尤其是他的母親——重新定義為敵對者、間諜或被操控的威脅。」OpenAI與微軟拒絕立即回應彭博社的置評請求。這是OpenAI首次捲入謀殺案。此前,OpenAI因被指控與加州一名高中生的自殺案有關而遭到起訴,但OpenAI否認存在過錯,稱ChatGPT曾多次建議這名青少年尋求幫助。由於AI機器人而產生的過失致死案件越來越多,科技公司在全國各地紛紛面臨訴訟。這起指控約20名OpenAI員工與投資人都被列為被告,亞當斯遺產管理人除了索取未透露金額的賠償,還請求法院下令OpenAI在ChatGPT增設安全防護措施。索爾伯格使用的是GPT-4o,這是ChatGPT先前的默認版本,但因對使用者過於順從奉承而飽受批評。 OpenAI今年10月說,相較於GPT-4o,最新的GPT-5模型在處理複雜的心理健康問題時,已將「不當回答」減少39%。 (洛杉磯生活互動)
剛剛,OpenAI迎10周年,發GPT-5.2,重點是和白領搶工作
8大榜點選敗Gemini 3 Pro,打平71%人類專家,數學競賽滿分。智東西12月12日報導,今日凌晨,正值OpenAI十周年生日,OpenAI正式推出其迄今最強模型GPT-5.2,並同步上線ChatGPT與API體系。本次更新包含GPT-5.2 Instant、Thinking與Pro三個版本,將從今日起陸續向Plus、Pro、Business與Enterprise等付費方案使用者開放,Free與Go使用者預計將於明日獲得存取權。同時,GPT-5.2也已納入API與Codex中供開發者呼叫。▲圖源:X平台現有的GPT-5.1將在ChatGPT中繼續作為過渡版本向付費使用者提供三個月,之後將正式下線。OpenAI官方稱,GPT-5.2屬於其持續改進模型系列的一部分,後續仍將圍繞過度拒絕、響應延遲等已知問題進行迭代最佳化。在API端,GPT-5.2 Thinking對應gpt-5.2,Instant對應gpt-5.2-chat-latest,Pro對應gpt-5.2-pro,開發者可直接呼叫。▲圖源:OpenAI官方部落格在價格方面,GPT-5.2的呼叫價格較上一代上調,輸入端1.75美元/百萬tokens(約合人民幣12.35元/百萬tokens)、輸出端14美元/百萬tokens(約合人民幣98.81元/百萬tokens)。GPT-5.2 Pro的定價為21美元與168美元/百萬tokens(約合人民幣148元與1185元/百萬tokens),並首次支援第五檔推理強度xhigh。▲圖源:OpenAI官方部落格OpenAI聯合創始人兼CEO Sam Altman在社交平台X上公佈了GPT-5.2在多項前沿基準上的成績:SWE-Bench Pro達到55.6%,ARC-AGI-2為52.9%,Frontier Math為40.3%。▲圖源:X平台這些基準主要用於衡量模型在複雜程式碼修復、通用推理與高難度數學任務中的表現,GPT-5.2在高階任務上的穩定性進一步提升。根據OpenAI官方部落格,GPT-5.2在涵蓋44個職業的明確知識工作任務中,表現均優於行業專業人士。相比GPT-5.1 Thinking,GPT-5.2 Thinking在應對知識型任務、程式設計、科學問題、數學、抽象推理的多項能力均大幅提升,尤其是在頂尖數學競賽AIME 2025拿到滿分成績,在OpenAI專業工作基準測試GDPval中戰勝或打平70.9%的人類專家。▲圖源:OpenAI官方部落格OpenAI團隊成員Yann Dubois也在社交平台X平台上發帖稱,GPT-5.2 Thinking的設計重點放在“經濟價值較高的任務”(如編碼、表格與演示文件)。▲圖源:X平台此外,在SWE-Bench Pro、GPQA Diamond等8項基準測試中,GPT-5.2 Thinking的分數均超過GoogleGemini 3 Pro和Anthropic Claude Opus 4.5。▲圖源:OpenAI值得一提的是,GPT-5.2在處理多模態任務方面的能力明顯提升,大有追上Gemini的架勢。“頂流”AI程式設計助手Cursor第一時間宣佈上新GPT-5.2。與此同時,微軟董事長兼CEO Satya Nadella宣佈,GPT-5.2將全面進入Microsoft 365 Copilot、GitHub Copilot與Foundry等產品體系。▲圖源:X平台在GPT-5.2的發佈會上,OpenAI應用業務負責人Fidji Simo也確認,外界關注已久的ChatGPT“成人模式(adult mode)”預計將在2026年第一季度上線。Fidji Simo稱,在推出該模式前,OpenAI希望確保年齡預測模型足夠成熟,能夠準確識別未成年使用者,同時避免誤判成年人。目前,該年齡預測模型已在部分國家進行早期測試,主要用於自動應用不同的內容限制與安全策略。01.專業任務能力躍升首次達到“專家級”評分根據OpenAI官方披露,GPT-5.2 Thinking在覆蓋44類職業任務的GDPval評測中,首次達到“專家級”表現——在70.9%的對比中戰勝或持平行業專業人士。GPT-5.2 Pro進一步提升至74.1%。在僅統計“明確勝出”的任務中,GPT-5.2 Thinking為49.8%,Pro則達到60%。這一評測覆蓋銷售演示、預算模型、營運排班、製造流程圖等多類真實業務成果。GPT-5.2在這些任務的生成速度約為人工專家的11倍,成本為其1%以下。在投研類任務中,GPT-5.2 Thinking在內部評測的投行三表模型與槓桿收購模型等場景中的平均得分為68.4%,較GPT-5.1 Thinking的59.1%有明確提升,GPT-5.2 Pro得分進一步增長至71.7%。▲圖源:OpenAI官方部落格▲GPT-5.1 Thinking與GPT-5.2 Thinking效果對比02.程式碼、工具呼叫與長鏈路任務全面升級在程式碼能力方面,GPT-5.2 Thinking在更嚴格的SWE-bench Pro(跨四種語言、強調真實工程難度)中取得55.6%,在SWE-bench Verified中更是達到80%,均顯著領先GPT-5.1的50.8%與76.3%。在SWE-Lancer IC Diamond任務中,GPT-5.2 Thinking取得74.6%(GPT-5.1為69.7%)。▲圖源:OpenAI官方部落格與此同時,GPT-5.2出現在AI基準平台Imarena.ai(Arena)排行榜中,並在WebDev測試中取得1486分,位列第二,僅落後榜首3分,領先Claude-opus-4-5與Gemini-3-pro等主流模型。另一個版本GPT-5.2則以1399分排在第六。根據Arena說明,GPT-5.2此前在內部以“robin”和“robin-high”為代號進行測試,其分數與GPT-5-medium僅相差1分,目前仍為初步結果,未來有望隨著測試量積累而進一步穩定。從評測維度來看,Arena主要衡量模型在可部署Web應用情境下的端到端編碼能力,GPT-5.2已反映出其在複雜任務鏈條上的實用性。在事實精準性方面,GPT-5.2 Thinking在基於ChatGPT查詢的無錯誤回答率(開啟搜尋模式下)達到93.9%,較GPT-5.1的91.2%有所改善,在無搜尋情況下也從87.3%提升至88%。▲圖源:OpenAI官方部落格另一個關鍵變化來自工具呼叫與長鏈路任務的可靠性提升。GPT-5.2 Thinking在Tau-2 Bench Telecom中達到98.7%的最高得分,在零推理模式下也大幅領先上一代,在更高噪聲的Retail場景中精準率從77.9%提升至82%。在更通用的工具鏈評估BrowseComp中,GPT-5.2 Thinking達到65.8%,Pro版本達到77.9%,亦高於GPT-5.1的50.8%。▲圖源:OpenAI官方部落格OpenAI提到,GPT-5.2 Thinking和Pro均支援第五檔推理強度xhigh,適用於長流程、多步驟、高精度的專業任務場景。03.在長上下文與視覺理解GPT-5.2全面增強在長上下文能力上,GPT-5.2 Thinking在OpenAI MRCRv2中全面領先上一代,在8 needles測試中從4k到256k的範圍內均保持遠高於GPT-5.1的表現,其中在4k–8k長度下達98.2%,在128k–256k長度下仍保持77.0%,而GPT-5.1同期為29.6%–47.8%區間。在其他長文場景中,BrowseComp Long Context(128k/256k)中,GPT-5.2 Thinking分別達到92.0%與89.8%。GraphWalks任務中,GPT-5.2 Thinking在bfs與parents子集分別達到94.0%與89.0%,相比GPT-5.1的76.8%與71.5%顯著提升。▲圖源:OpenAI官方部落格在視覺理解上,GPT-5.2 Thinking在CharXiv科學圖表推理任務中無工具模式下為82.1%,開啟Python工具後進一步提升至88.7%。在ScreenSpot-Pro介面理解中,GPT-5.2 Thinking取得86.3%,遠高於GPT-5.1的64.2%。在視訊類、多模態綜合難度更高的Video MMMU中,也從82.9%提升至85.9%。在視覺能力上,GPT-5.2在ScreenSpot-Pro(介面理解)中達到86.3%的精準率,相比GPT-5.1有明顯提升。在CharXiv科學圖表推理任務中,也實現了準確率的大幅增長。這使其在處理科研圖表、營運儀表盤、產品介面截圖等專業視覺輸入時更加可靠。▲圖源:OpenAI官方部落格04.微軟全家桶同步升級GPT-5.2成為新一代“生產力模型”隨著GPT-5.2發佈,微軟董事長兼CEO Satya Nadella也在社交平台X平台上宣佈,GPT-5.2將全面進入Microsoft 365 Copilot、GitHub Copilot與Foundry等產品體系,並作為新的“默認推理模型”服務更多工作流場景。在Microsoft 365 Copilot中,使用者已經可以通過模型選擇器啟用GPT-5.2,用於會議記錄分析、文件推理、市場研究與戰略規劃等高複雜度任務。Nadella稱,將模型與使用者工作資料結合後,GPT-5.2能夠更充分發揮推理優勢。在GitHub Copilot中,GPT-5.2適用於長上下文推理與複雜程式碼庫審查,重點覆蓋跨檔案關係分析、依賴追蹤與重建構議等工程類使用場景。此外,GPT-5.2還同步進入Microsoft Foundry與Copilot Studio,開發者可在建構自動化流程、企業內部Agent或自主開發時直接呼叫GPT-5.2模型。面向消費者端的Copilot也將隨後啟動分階段更新,逐步替換當前版本。▲圖源:X平台從微軟生態的覆蓋面來看,GPT-5.2已被定位為“默認生產力模型”,在不同產品線之間以自動模型選擇的方式服務更廣泛的開發、寫作與分析任務。此外,頂流AI程式設計助手Cursor也已第一時間火速上線GPT-5.2,並同步沿用OpenAI官方API價格。▲圖源:Cursor05.結語:GPT-5.2的能力邊界正向“穩定、實用”收攏從多項公開基準測試到Arena針對Web應用端到端能力的評測結果,GPT-5.2展現出的整體能力向穩定可用和任務完成度方向收攏。隨著Instant、Thinking與Pro組成的多檔能力體系的開放,GPT-5.2在不同工作流中被切分為更清晰的使用場景。而在微軟生態中的全面接入,也進一步強化了這一變化的方向。無論是在M365 Copilot中承擔跨文件推理,還是在GitHub Copilot中處理長上下文程式碼鏈路,GPT-5.2都開始參與到更高頻、更具體的任務流程中。除了推出面向專業工作和智能體的前沿模型外,OpenAI還宣佈已經與迪士尼達成授權協議,允許Sora 2使用者在生成並分享的圖片中使用迪士尼角色。迪士尼將向OpenAI投資10億美元(約合人民幣71億元),並擁有未來增持股份的選擇權。 (智東西)
一文讀懂GPT-5.2 : 迎戰Gemini,號稱智能體編碼最強,趕超人類專家,Altman料1月解除紅色警報
GPT-5.2三種版本周四上線ChatGPT付費套餐,其中Instant主打快速高效,Pro是高品質回答的最智能且可靠選擇,和Thinking是最佳科學家助手模型;Thinking被稱為最佳視覺模型,刷新SWE編碼能力測試最高分,是OpenAI首個性能達到或超過人類專家的模型,GDPval職業知識測試中完成任務速度是專家的11倍以上,成本不到專家的1%。Altman稱Gemini 3對OpenAI的影響沒之前擔心的大。OpenAI周四正式發佈GPT-5.2系列模型,打響了迎戰GoogleGemini 3的第一槍。CEO Sam Altman淡化Gemini 3帶來的衝擊,預計明年1月就可以解除所謂“紅色警報”的狀態,以非常強勁的姿態重回常態GPT-5.2是OpenAI迄今最先進的人工智慧(AI)模型,針對專業工作場景進行了全面最佳化,創多個基準測試的行業記錄,其中的GPT-5.2 Thinking刷新了SWE編碼能力測試的歷史最高分,也是OpenAI首個性能達到或超過人類專家水平的模型。OpenAI應用業務的CEO Fidji Simo表示,GPT-5.2在建立電子表格、製作簡報、圖像識別、程式碼編寫和長文字理解等方面均優於前代產品,旨在"為人們創造更多經濟價值"。OpenAI的研究副總Adain Clark稱,GPT-5.2在數學推理方面的進步意味著它能更好地處理金融建模、預測和資料分析等任務。OpenAI宣佈,周四當天GPT5.2就在ChatGPT上線,面向Plus,、Pro、Go、Business和 Enterprise這些付費套餐的使用者, 共推出Instant、Thinking和Pro三個版本,API也同步開放給所有開發者。在ChatGPT中,付費使用者可使用三個版本的GPT-5.2,且在未來三個月內仍可繼續使用GPT-5.1。在API平台,GPT-5.2定價為每百萬輸入token 1.75美元、每百萬輸出token 14美元,快取輸入可享受90%折扣。雖然單token價格高於GPT-5.1,但OpenAI表示,由於模型效率更高,達到相同質量水平的總成本反而更低。新模型發佈是OpenAI對Gemini 3掀起又一輪競爭的正式回應。本周稍早媒體稱OpenAI的CEO Sam Altman最近發佈內部"紅色警報"備忘錄,要求公司將資源集中用於改進ChatGPT。幾周前,Google推出的Gemini 3因其推理和編碼能力廣受好評,迅速登上LMArena和Humanity's Last Exam等權威排行榜榜首,給OpenAI帶來壓力。評論認為,GPT-5.2 與其說是重新發明,不如說是對OpenAI最近兩次升級的整合。8月發佈的 GPT-5 是一次重設,為統一系統奠定了基礎,它可以在快速默認模型和更深入的“思考”模式之間切換。11月發佈的 GPT-5.1專注於使該系統更加友好、更具對話性,並更適合智能體和編碼任務。GPT-5.2似乎進一步提升了所有這些進步,使其成為生產應用更可靠的基礎。三個版本GPT5.2分別主打快速、深度、智能可靠對於周四提供的三個版本GPT 5.2,OpenAI分別介紹稱,Instant是快速高效的日常工作和學習助手,在資訊查詢、操作指南、技術寫作和翻譯方面均有顯著提升。,並延續了 GPT-5.1 Instant 中更親切的對話風格。早期測試者尤其注意到,GPT-5.2 的解釋更加清晰,能夠直接呈現關鍵資訊。Thinking 專為深度工作而設計,能夠幫助使用者更高效地完成更複雜的任務,尤其是在編碼、總結長篇文件、回答有關上傳檔案的問題、逐步進行數學和邏輯運算、以更清晰的框架和更有用的細節輔助規劃和決策方面。Pro是需要高品質回答難題時“最智能、最可靠”的選擇。早期測試表明,它在程式設計等複雜領域表現更出色,且重大錯誤更少。性能全面領先,多項基準測試創新高GPT-5.2在多個關鍵基準測試中刷新了行業紀錄。在GDPval測試中,該模型在涵蓋44個職業的知識工作任務上,有70.9%的表現達到或超過行業專家水平。OpenAI稱,GPT-5.2 Thinking完成這些任務的速度是專家的11倍以上,成本不到專家的1%。在編碼能力方面,GPT-5.2 Thinking在SWE-Bench Pro上取得55.6%的成績,在SWE-bench Verified上更是達到80%的新高。這一基準測試真實世界軟體工程任務,涵蓋四種程式語言。OpenAI的產品負責人Max Schwarzer表示,GPT-5.2在程式碼生成和偵錯方面取得重大進步,Windsurf和CharlieCode等編碼初創公司報告稱該模型實現了"最先進的智能體編碼性能"。OpenAI聲稱GPT-5.2 Thinking是"世界上最好的視覺模型",在圖表推理和軟體介面理解方面的錯誤率降低了約一半。在長文字處理上,該模型在OpenAI MRCRv2測試中率先在25.6萬token範圍內實現近100%的精準率,使其特別適合深度文件分析和多源資訊工作流。在科學研究領域,GPT-5.2 Pro在GPQA Diamond測試中達到93.2%的精準率,GPT-5.2 Thinking緊隨其後為92.4%。在專家級數學測試FrontierMath上,GPT-5.2 Thinking解決了40.3%的問題,創下新紀錄。OpenAI稱GPT-5.2 Pro和GPT-5.2 Thinking是"世界上最好的科學家助手模型"。Altman稱Gemini 3影響沒擔心的大面對Gemini 3帶來的競爭壓力,Altman周四接受媒體採訪時表示:“Gemini 3對我們指標的影響可能沒有我們擔心的大。”他預計,OpenAI將在明年1月前以“非常強勢的地位”退出紅色警報模式。關於紅色警報的原因,Simo在記者會上解釋稱:"我們宣佈紅色警報是為了向公司發出訊號,表明我們希望將資源集中在某個特定領域,這是明確優先事項和可降級事項的方式。" 她強調,雖然ChatGPT獲得了更多資源投入,但GPT-5.2的發佈已籌備多月,並非因紅色警報而匆忙推出。雖然Altman據稱在內部備忘錄中將圖像生成列為優先事項,但此次OpenAI的新品發佈並未包含新的圖像生成器。據報導,OpenAI計畫在明年1月發佈另一款新模型,將提供更好的圖像生成、更快的速度和更強的個性化能力,但公司周四未確認這一計畫。OpenAI還宣佈推出年齡預測軟體,以便為18歲以下使用者提供內容保護。Simo透露,公司將在明年第一季度推出"成人模式",Altman此前表示該模式可能允許"為經過驗證的成年人提供情色內容"等用途。企業客戶成為爭奪焦點GPT-5.2的發佈明確瞄準企業市場。OpenAI本周早些時候發佈的新資料顯示,過去一年其AI工具的企業使用量大幅飆升。公司稱,ChatGPT Enterprise平均使用者表示AI每天為他們節省40至60分鐘,重度使用者每周節省超過10小時。Notion、Box、Shopify、Harvey和Zoom等企業客戶觀察到,GPT-5.2展示了最先進的長周期推理和工具呼叫性能。Databricks、Hex和Triple Whale發現該模型在智能體資料科學和文件分析任務上表現出色。Cognition、Warp、Charlie Labs、JetBrains和Augment Code則表示GPT-5.2提供了最先進的智能體編碼性能。在工具呼叫方面,GPT-5.2 Thinking在Tau2-bench Telecom測試中達到98.7%的精準率,展示了其在長時間、多輪次任務中可靠使用工具的能力。在一個涉及航班延誤、轉機失敗和醫療座位需求的複雜客戶服務案例中,GPT-5.2成功協調了重新預訂、特殊協助座位和補償等全部流程。這一戰略轉向正值關鍵時刻。OpenAI已承諾在未來幾年投入超過1兆美元用於AI基礎設施建設,但如今Google正在迎頭趕上。據報導,OpenAI的推理計算支出大部分以現金支付而非使用雲積分,表明公司的計算成本已超出合作夥伴關係和積分所能補貼的範圍。對推理模型的加倍投入可能形成惡性循環:為贏得排行榜而增加計算支出,然後為大規模運行這些高成本模型而進一步增加支出。在定價策略上,雖然ChatGPT訂閱價格保持不變,但API中的GPT-5.2單token價格高於GPT-5.1,不過仍低於其他前沿模型。OpenAI目前沒有棄用GPT-5.1、GPT-5或GPT-4.1的計畫,並承諾會提前充分通知開發者任何棄用計畫。 (invest wallstreet)
Open AI 的8億周活使用者,到底意味著什麼?——a16z前合夥人如何為AI“降噪”(下)
在上一期的【泉果探照燈】中,我們介紹了“25年來致力於去除科技行業噪音”的前a16z合夥人Benedict Evans,他從過去20年的科技迭代的歷史視角,試圖為大家還原一個對AI既不誇大,也不恐懼的“喧囂之下的真相”。您可以從這裡回溯上一篇文章,以獲得關於Benedict更為完整的介紹:時光倒流20年,資本的科技敘事是如何演化的?——a16z前合夥人如何“降噪”(上)今天,我們繼續連載Benedict的AI核心觀點,主要回答3個問題:■  AI將在那些環節產生價值?■  它會通過什麼管道送到我們手中?■  它會摧毀什麼?又會催生什麼?以下是Benedict第一人稱視角精編:AI模型的護城河,到底在那裡?我們可以做個“盲測”:發同樣的指令給ChatGPT, Grock, Claude, Gemini, Mistral和DeepSeek。我敢打賭,只看答案,大多數人都分不清那個是那個。讓我們看看自從ChatGPT上線以來,發生了什麼?資本投資大量湧入、模型價格迅速下探、新東西層出不窮,熱詞縮寫滿天飛,但我們至今並沒有看到清晰的“護城河”,也沒有看到明顯的“贏家通吃”。關於科技大廠的CapEx和ROI的擔憂,大家聊得很多了,這裡不再贅述。他們的心態,用下面這一句話概括就足夠了:投資不足的風險,遠遠大於投資過度的風險。——Google CEO Sundar pichai,2024 Q2因為任何一個錯過“可能成為平台轉移”的窗口,都可能付出巨大的代價。比如微軟在從PC到智慧型手機的轉換中,教訓非常慘痛,這也讓它這次的押注更加堅決。結果就是,我們看到越來越多的大模型不斷湧現(如下圖),每周都有很多新增的模型,到年底更是進入了集中發佈期。圖1. 更多的大模型來源:《AI eats the world》模型有優劣,但頭部模型的差距其實並不大。下面這張圖顯示了兩個通用的基準測試,柱狀條表示:前十名模型的得分佔當周“第一名模型”的百分比。簡單說,所有模型彼此之間其實只差5%~10%。另外,第一名一直在變。每周都可能會出現一個新的“績優生”,有時領先會超過5%,但很快大家的性能又都收斂到了類似的區間。圖2. 頭部模型功能差距不大、第一名每周都有變化來源:《AI eats the world》但是,有一個指標可以拉開差距,那就是模型的使用量。如下圖,雖然模型能力相差不多,模型越來越接近“可替代的商品”,但是市場份額卻差距巨大。什麼決定了使用者會使用?更多的取決於品牌(ChatGPT)、管道(Microsoft Copilot)或生態繫結(Google)。同時,ChatGPT似乎正在成為一個動詞,就像Google成為搜尋的動詞一樣,這意味著它在成為一種默認選項。圖3. 誰決定了使用量:技術?品牌?還是管道?來源:《AI eats the world》如果退後一步,這些縮寫詞、性能圖表、參數指標和跑分基準……看起來很像20-30年前的個人電腦產業。那時你必須懂得那些術語縮寫才能買電腦,包括知道多少MHz,多少MB,用的是那款晶片。曾經組裝過電腦的人應該都熟悉,這是90年代的電腦雜誌封面:《191款最快的486電腦買家指南》《提速:CPU、顯示卡、主機板》《最快的56k數據機橫評》圖4. 速度、參數、各種縮寫:當年我們就是這樣對比電腦的來源:《AI eats the world》當一個技術剛出現時,所有人都會把注意力放在“參數比拚”上。但是技術成熟後,這些參數會變得無關緊要,這時,價值也會移動到系統、品牌、生態、應用等的其他層級。AI也可能會重複這個過程,當模型越來越標品化,價值則會延著價值鏈向上移動。所以,如果你是一個LLMs實驗室,你該如何競爭呢?你有兩個路徑:■  往下走,變成資本戰:像晶片、飛機製造、AWS那樣拼投入、拼規模化資本成本。■  往上走,變成軟體行業邏輯:拼產品、拼網路效應、拼“進入市場能力(Go-to-Market)”。而你最不能做的就是:拿出一個同質化的模型,然後簡單地給它貼個價簽。Open AI 的8億周活使用者,到底意味著什麼?從一個常被引用的數字說起:Open AI的8億周活使用者。乍一看,這個數字足以讓人覺得,“AI已經無處不在,塵埃落定了”。但需要追問的是,每周活躍一次,到底意味著什麼?綜合多份美國的調查,實際AI使用更接近於這樣一個分佈:每天用:約10%;每周用:15–20%;每月或每兩個月用一下:20–30%;看過,試過,然後就沒然後了:20-30%。在社交媒體時代,如果你真的喜歡一個app,那麼你應該是日活使用者。如果只是每周用一次,很難說它改變了你的生活——Sam Altman是做社交媒體起家的,他當然知道“周活使用者”這個指標很唬人。其實企業端,我們也觀察到了類似的節奏。現在大概有1/3的大企業,至少已經上線了一個生成式AI的應用,但還有1/4的企業甚至還沒有計畫做任何部署(如下圖)。圖5. AI落地比想像的慢?——許多大公司要到2026才真正開始動手來源:《AI eats the world》你會看到Accenture——全球最大的管理諮詢和技術服務公司——每個季度都有超過15億美元的AI新訂單,有很多試點項目在排隊上線。圖6. 當企業不知道怎麼用AI,就會去問諮詢公司Accenture AI合同金額持續上漲來源:《AI eats the world》但是,需要留意的是,從試點到真正投入使用,永遠需要時間。雖然過去一年多以來科技圈一直在大喊“代理化”(agentic),真正能在生產環境落地的,其實比例非常低。如果回看過去幾十年的技術擴散,你會發現一個“三步走”的模式:第一步:吸收(Absorb)將新技術作為功能外掛,塞進現有流程,先把能自動化的事情自動化。第二步:創新(Innovate)誕生新產品、新服務、新的捆綁(bundling)和解綁(unbundling)模式。第三步:顛覆(Disrupt)重新定義問題,重塑市場結構。圖7. 每一次平台轉換都遵循同一個節奏來源:《AI eats the world》到目前為止,大部分AI應用還在第一階段——自動化那些顯而易見的工作,比如客服自動回覆、行銷文案生成、軟體開發輔助……這都很正常,所有技術部署都需要時間。比如雲端運算,它在科技行業大概已經算很老的概念了,但實際上它在企業工作流的滲透率只有1/3左右。但是,雖然部署很慢,一旦部署完成,整個企業的運轉方式將會徹底改變。條形碼就是一個經典例子。它在1974年問世,而真正普及是在幾十年之後,可是一旦普及但能管理5倍甚至10倍數量的商品,改寫了整個超市零售的營運方式。AI也會如此。圖8. “條形碼”的部署處理程序來源:《AI eats the world》AI 帶來的真正改變,會發生在那裡?在經歷了無數場AI匯報會、內部試點、demo演示之後,大家難免都會問:AI帶來的真正改變,會發生在那裡?除了自動化,AI還可能是什麼?這個問題,在今天,就像1997年撥號龜速上網的人在問,網際網路到底能幹嘛?——當時沒人能夠想像會有外賣、直播、電商、短影片、移動支付……我們現在也站在這樣一個“模糊卻又隱約可見”的入口。那麼,我們至少可以追問兩個更基礎的問題。■  問題一,AI會拆解什麼?網際網路的故事,其實就是“拆解”的故事:很多書店被拆掉了、電台被拆掉了、報紙被拆掉了……不需要物理形態,也能創造價值。那麼——LLM會拆解什麼?那些過去依賴“人”的部分,會從結構上被抽離出來?■  問題二,AI會重組什麼?網際網路創造了很多新的聚合模式,比如Amazon聚合零售,DoorDash聚合餐飲(類似於中國的美團/餓了麼),Instagram聚合社交,那麼AI能不能提供不同維度的“聚合”?它們的底層邏輯,是演算法替代了人工編輯。而LLMs不僅僅是看你會喜歡什麼,它還能理解你的意圖、你問問題的方式,甚至你沒有說出來的偏好。假如推薦系統能更深層的“懂你”,平台和演算法邏輯會如何改變?以廣告為例,廣告行業是個兆美元規模的市場,目前科技巨頭吃掉了其中一半的收入。現在大家都在用AI最佳化現有業務:行銷團隊原來一個項目做5張物料,現在變成了做200張,甚至300張。這讓我想起了一個古早的笑話:一部分人用AI把三個要點擴寫成一封郵件,另一部分人用AI把一封郵件總結為三個要點。假如現在AI能把三個要點,變成300個廣告。那麼問題來了:誰來理解這些廣告?誰來分發它們?誰來決定該向誰展示?這將通向“代理式消費”(agentic commerce):我不再從亞馬遜中搜尋、不再刷Instagram、而是直接問GPT,我該買那個?泉果視點註:“代理式消費”(agentic commerce)由AI代理幫你完成選品、比較、決策甚至下單的一種消費模式——從“我在平台上自己找東西”,變成“我把任務丟給一個AI助手,讓它幫我搞定”。就像我拍了冰箱存貨的照片給AI,問它我今晚應該做什麼菜,還需要買什麼食材。這不是更快的“購物流程”,而是一種新的“生活路徑”。圖9. 讓AI根據冰箱存貨規劃菜單來源:《AI eats the world》當然,這一切目前還非常早期。這張圖我很喜歡,這是一家東京的書店,它只有16平米,每周只買一本書。你不需要選擇,因為你只有一個選項。圖10. 一室一冊的森岡書店但是在網際網路世界裡,你面前是無限的貨架,為了避免迷失,我們只能依賴不完美的推薦系統。而未來,很可能會變成,每個人都能擁有一間只賣給你一本書的書店——它知道你是誰、你要什麼,也能把最適合你的那一件東西拎出來。未來的系統不再只問“你想買什麼”,而是會反向去理解:“你為什麼想買它?”——你是想獲取功能,還是想獲取體驗?是追求效率,還是審美、品味和身份?AI對人的動機建模,成為推薦系統的新核心。換句話說,我們的AI策略應該是什麼?這個問題沒有統一答案,而是一組關於動機的問題集合,它取決於:誰在問?他處於什麼行業?他為什麼在問這個問題?就像一面鏡子,不同的人會照出不同方向,這才是真正決定答案的因素。結 語停下來,看看AI“嶄新”的外表下,那些似曾相識?我的最後一個觀察是,雖然AI似乎吸引了全部的目光,但那些在AI之前讓我們興奮的技術,其實從未離場。電商已經佔到零售的30%,並且還在繼續增長,尤其在美國之外發展更加迅速。Robotaxi正在各個城市跑起來;Meta的眼鏡、各種形態的機器人,都在悄悄變得更成熟,它們都值得期待。但我們其實應該停下來,想想在“嶄新”的外表下,有些事情是不是似曾相識?這是1951年IBM的廣告:我們的“電子計算器”能讓一個人擁有150名工程師的能力——今天多少AI廣告,其實也在說同樣的話。圖11. 1951年IBM電子計算器廣告1955年,美國政府發佈了一份關於“自動化”的報告,那時候他們把所有新技術都叫自動化。其中提到,有一種可能會被自動化的工作,是電梯操作員。這張照片是我家公寓裡的老式電梯,以前坐電梯需要一個專業電梯員操控。當時還有一個詞叫“電子禮節”(electronic politeness),用紅外線確保電梯不會夾到人。圖12. 老式的手動電梯但是,請問你上一次按電梯時,有沒有意識到自己在用一個“擁有電子禮節的自動化電梯”?你不會。它現在只是一個再普通不過的“電梯”。我們建了大量電梯,然後把它們自動化,再之後——我們完全忘了它們曾經不是自動化的。就像開篇Larry Tesler說過的觀點:“AI是那些機器還做不到的東西——一旦它能做到,我們就會說,那只是軟體。”我們的世界就是這樣不斷改變的。每隔10年,我們“自動化”了一些東西;再過10年,我們忘了它曾經需要人力;又過10年,它們變成了世界隱形的背景。而就在這個過程中,世界被一次次地重新書寫。 (泉果視點)
DeepSeek 與 Google 的暗戰:誰會最先找到通往 AGI 的鑰匙?
自從 2022 年 ChatGPT 3.5 橫空出世,讓世人領略到 AI 的非凡魅力;再到 2024 年底 DeepSeek 驚豔登場,給國人帶來了巨大的驚喜與自信。如今,各類大模型(LLM)及 AI 應用已經深刻地改變了我們的生活。AI 每天都在增強功能。昨天做不到的事,今天已經能做;前天做不好的題,今天已經可以輕鬆解決。我們彷彿回到了蒸汽機投入實用後的那段時間——新技術、新發明以肉眼可見的速度狂飆突進。然而,在這波 AI 浪潮的狂歡背後,科技界仍存爭議:LLM 真的是通往 AGI(通用人工智慧)的正確方向嗎? 或者說,僅靠當前的 LLM 就足夠了嗎?答案其實很清晰:不夠。Transformer 是一次偉大的突破,但要讓機器真正“理解世界”,我們仍需要更多類似 Transformer 等級的全新核心技術。凍結的知識快照不是智能我們知道,當前大模型的訓練方法,本質是讓 Transformer 在大量文字裡尋找“詞與詞的關係”,並基於這些統計關係預測下一個詞。訓練完成後,所有知識都被壓縮排最終的權重檔案裡,像一張凝固的“知識快照”。 但之後它不會自動學習新知識,除非重新訓練或微調。明天產生的新知識無法自動融入,換言之,LLM 本身沒有即時的學習能力。從上面你很快能就發現當前基於LLM的AI的兩個“死穴”:其一,LLM只是一個機率模型,它知道“E=mc²”後面大機率跟著“愛因斯坦”,也知道怎麼用這句話造句,但它不知道這公式是怎麼推匯出來的,也不知道如果光速改變了世界會怎樣。它學到的是知識的“投影”(文字),而不是知識的“本體”(邏輯與因果)。其二,它的知識是靜態的。正因為它沒有一個知識的生產過程,所以它不知道這些知識是如何產生的,為什麼會形成這個知識,這些知識為什麼對,為什麼錯。正如X上有某位大佬所言:“當前 AI 水平離真正的 AGI 還差好幾個 Transformer 等級的創新。” 但遺憾的是,現在還沒有可以取代Transformer的新架構。在這一點上,中美其實“站在同一片荒原上”,未來怎麼走,大家都在摸索。理解知識的積累過程,是智能的前提嗎?回想一下人類的學習方式:從小到大,知識是一點一滴積累的,對同一個知識點的理解也是層層遞進的。相比之下,LLM 生成即“凍結”,缺失了進化的過程,所以它“知道”,但它不“理解”。那麼,將知識的積累過程保留下來,會不會是通往 AGI 的一個方向?如果 AI 能復現人類對某個現象的認識過程,是否就能理解其背後的原理,從而舉一反三?至少,可以將這個認識過程當作一種“元模式”記錄下來,在處理新問題時按部就班地套用。當然,這個觀點也存在爭議。因為許多科學突破是“斷層式”的——先是天才的“靈光一閃”,後人再通過邏輯去填補證據。不過,從人類的普適經驗來看,模擬知識的積累過程,肯定有助於 AI 達到人類智能的平均水準。我們不指望 AI 頓悟成愛因斯坦,但達到專家的水平是完全可期的。這個過程可以從兩個角度來分析一是知識的層級性,高階知識依賴並建立在前導知識(基礎概念、技能)之上。比如說,一個人學習流體力學前,需掌握微積分與線性代數。二是學習的漸進性,對具體知識的理解和記憶,是一個從模糊、具體到清晰、抽象的動態過程。對於個人來說,對新概念的掌握,會從最初的生硬記憶,逐漸內化為可靈活運用的直覺。Google的思考:結構化與記憶針對第一個維度(層級性),Google 試圖將模型的知識結構化為不同時間尺度、相互巢狀的層級,提出了“巢狀學習”(Nested Learning)與記憶框架。(參見論文:https://abehrouz.github.io/files/NL.pdf)。“巢狀學習”的核心是將一個複雜的AI模型,視為一系列相互巢狀的最佳化問題。簡單來說,模型的不同部分可以像人的不同記憶一樣,以不同的“速度”學習和更新。簡單舉例,一般的LLM訓練,對於一個文字來說,可以理解成一個平面,從上而下,流式分佈。然後訓練過程相當於找出每個字之間的關係機率,因為處理窗口的關係,如果算到了後面的內容,往往與前面的文字關係就小了,計算時用的權重也就低了。如同一篇小說,即使作者費盡心機在結尾時回應了開頭處的一個梗,填了開始的一個坑,對於AI來說,也是拋媚眼給瞎子看。AI早就忘記了。而Google的巢狀學習,則是對同一篇文章,除正常的訓練方式外,還對文章先在不同的層次上進行預處理。比如先做一個文章梗概,先過一遍文章,把所有作者預埋的“坑”提取出來……,這樣一篇文字就變成了n篇不同維度文字,然後在訓練時,這些文字都參與訓練,可以平行處理,只是訓練參數和訓練方法不同。能根據性質選擇不同精度和速度的計算,而且訓練出的成果是可以疊加的,不再是單一固定的權重檔案。上面的圖就是一個例子,左邊是普通的深度學習訓練過程,而右邊則是巢狀學習的例子,你能看出對於同一個內容,根據進行多次訓練,只是廣度和精度各不相同。此外,Google 的 ReasoningBank 記憶框架(相關論文:https://arxiv.org/abs/2509.25140 )則更進一步。它的思路是讓AI智能體從以往的成功與失敗經驗中,主動提煉出結構化的“記憶項”。每個“記憶項”包含策略標題、描述和推理內容,本質上是對低級經驗的抽象總結。當面對新任務時,AI會檢索並應用這些抽象原則來指導行動,這模擬了人類專家運用已有知識框架去解決新問題的過程。DeepSeek的嘗試:多維感知與自驗證推理針對第二個維度(漸進性),DeepSeek 在感知與推理兩個層面都展現了對人類思維模式的深度模擬。首先在視覺感知層面,以 DeepSeek-OCR 為例,他們採用了一種獨特的“多解析度訓練”思路:不僅僅是對圖像進行簡單的向量化,而是試圖模擬人類的視覺認知過程——即 “從模糊到清晰” 的動態掃描。對同一張圖片(場景),模型會同時學習其低解析度的宏觀輪廓與高解析度的微觀細節(相關技術細節可參看此前的公眾號文章)。這種策略暗合了人類大腦處理視覺資訊的生物學模式:先建立全域印象,再填充局部細節。不僅在感知上發力,DeepSeek 更試圖在推理層面重現人類的“反思”能力。DeepSeek 不僅在基礎大模型上發力,向各個專家模型演進(如 DeepSeekMath-V2),更在某些領域嘗試模擬人類的“記憶狀態”。在 2025 年 11 月 27 日剛剛發佈的 DeepSeekMath-V2(論文:https://arxiv.org/pdf/2511.22570 )中,DeepSeek 引入了突破性的 “自驗證”(Self-Verification) 機制。這相當於讓 AI 進化出了“自我監考”的能力。傳統的模型像是一個只顧填答題卡的考生,只在乎最終答案是否命中;而 DeepSeekMath-V2 則像是一個嚴格的老師,它不僅檢查答案的對錯,更會一步步審視 解題過程(Process) 的邏輯鏈條。通過這種方式,模型不再是“蒙”對了一個答案,而是真正確信自己“理解”了這道題。這種從“結果導向”向“過程導向”的轉變,是 AI 邁向深度邏輯推理的關鍵一步。DeepSeek 的“自驗證”機制構成了一個自我完善的智能閉環:它不僅能評估解題過程,更能主動生成推理步驟並對其驗證。這模仿了人類的元認知與自我學習能力。古人倡導“吾日三省吾身”,而 AI 則可實現瞬時、高頻的自我審視與迭代最佳化。如下圖(論文中的附圖)所示,隨著驗證次數(最高達7次)的增加,模型解決問題的能力顯著提升,充分體現了通過“反覆自學”實現能力進化的潛力。雖然上述分別列舉了兩家公司的例子,但在技術演進的洪流中,它們並非孤立存在。Google 的巢狀學習涉及不同清晰度資料的處理,而 DeepSeek 的多專家系統(MoE)及多層次資料訓練,本質上也是在對知識進行結構化拆解。結尾:AGI的未來方向,也許正在悄悄顯現從 Google 到 DeepSeek,我們正在看到一個趨勢越來越明確:真正的智能,不是更大的模型,而是更“結構化”的學習過程。未來的 AI,可能會具備:能分層理解知識結構的能力能保持多時間尺度記憶的能力能自主總結“經驗規則”的能力能在模糊與清晰之間漸進切換的能力能記錄“知識的進化史”而不是只記錄結論這些能力加在一起,不是“下一代更大的 Transformer”,而是:一種能夠像人一樣“成長”的架構。我們或許距離 AGI 仍有數個重要突破,但路徑正在變得越來越清晰:不是簡單堆算力、堆資料,而是讓模型獲得“理解知識如何生成”的能力。或許,真正的智能不是一夜之間的奇蹟,而是一次又一次讓機器“重走人類認知之路”的漫長積累。而現在,我們正在走在這條路的最前面。 (亍雲旁觀)
OpenAI預測:2030年ChatGPT付費使用者將達2.2億,周活躍使用者達26億
OpenAI預測2030年ChatGPT付費使用者將達2.2億。為提升ChatGPT收入,OpenAI正藉鑑企業級應用Zoom和Slack的商業模式:先透過免費版吸引大量使用者(目前已超8億),再推動這些使用者的僱主簽署企業級訂閱服務。據悉,截至今年7月,約3,500萬名使用者(佔周活躍使用者的5%)付費訂閱了Plus版本(月費20美元)或Pro版本(月費200美元)。目標2.2億付費使用者OpenAI預測五年後(2030年),ChatGPT周活躍使用者將達26億,約8.5%(即2.2億人)將付費使用Plus版本。若真如此,ChatGPT的訂閱服務規模將躋身全球前列-目前Netflix和Spotify各自擁有約3億付費使用者,Slack(Salesforce旗下)則表示其付費使用者超過20萬。更貼切的參考系可能是微軟Office 365辦公套件(付費使用者量約達4.5億)。儘管ChatGPT主要用於個人場景,但OpenAI正持續增強其辦公功能,例如可以共享聊天記錄、透過Slack等工具連接企業內部資料。這些功能可能使ChatGPT成為Office 365和Google Workspace的直接競爭對手——後兩者也正在增加自動撰寫郵件等AI功能。訂閱量對決:OpenAI近期及預期的ChatGPT訂閱量與其他熱門付費訂閱服務的比較(資料來源:《The Information》、公司檔案及公告)這些先前未公開的預測資料,揭示了OpenAI的CEO山姆·阿爾特曼及其團隊的計畫:利用ChatGPT的先發優勢,到本世紀末實現年收入達到2,000億美元(今年約為130億美元)。今年夏季OpenAI上調了ChatGPT的營收預期,預測2030年其訂閱服務將創收約2,700億美元,2030年單年收入預計達870億美元(今年為100億美元)。ChatGPT目前及預期的營收成長,近期將OpenAI估值推升至5,000億美元(超越埃克森美孚、強生和Netflix等巨頭)。同時OpenAI預測今年至2029年的現金消耗總額將達1,150億美元。增長波動與模式選擇值得一提的是,這些預測的發佈早於Google推出Gemini 3。根據Sources報導,OpenAI的CFO莎拉·弗里爾上月承認,由於公司自8月起實施的ChatGPT內容限制(禁止與18歲以下使用者進行曖昧互動或討論自殺話題,在無法驗證使用者年齡時會限制聊天範圍),使用者使用時長略有下降。OpenAI計畫於12月推出年齡驗證系統,屆時經核實的成年使用者將獲得更大自由度。目前ChatGPT在聊天機器人市場仍佔據主導地位。據悉,其9月周活躍使用者數較去年同期成長超三倍,遠超GoogleGemini第三季的月活躍使用者規模(6.5億)。然而,其今年的周活躍使用者成長波動劇烈:1月環比增長42%,但9月環比僅增長13%。定價策略:OpenAI推出面向消費者和企業的分級產品(註:按年計費;來源:OpenAI)知情人士表示,隨著更多員工自發使用ChatGPT,OpenAI希望透過與企業達成企業級協議來增加付費使用者。這類似於上世紀末Zoom(影片會議應用)和Slack(聊天應用)的策略:免費版在個人使用者中普及後,軟體公司得以向企業高管推銷付費訂閱服務。目前企業使用者ChatGPT使用者中佔比較小。上月OpenAI透露,已有700萬企業使用者透過ChatGPT商業方案訂閱其服務——包括面向中小企業的ChatGPT Business和面向大型企業的ChatGPT Enterprise。這些服務為Canva、普華永道等客戶提供專屬安全合規功能,並支援與Slack、Google Drive、GitHub等企業工具整合。阿爾特曼向員工談及Gemini 3即將發佈時表示:「我堅信我們擁有絕對優勢,能打造使用者首選的AI平台。」同時也警示GoogleAI的強勢復甦可能帶來「經濟逆風」。OpenAI的訂閱模式與新興競爭對手Anthropic形成鮮明對比-後者約80%營收來自透過API(應用程式介面)銷售模式存取權。Anthropic預測其今年的API銷售額將達到OpenAI的兩倍,而其Claude聊天機器人訂閱量僅為ChatGPT的十分之一。初創公司Docket.io(主要銷售基於OpenAI模型的AI智能助理)聯合創始人兼CEO阿瓊·皮萊表示,他已使用ChatGPT付費服務超兩年,今年將升級200美元套餐。數月前,他還為員工增購ChatGPT Business訂閱,看中的正是其與HubSpot及Slack工具的整合能力。協作功能同樣極具吸引力。 “我可以建立項目並與他人共享,無需對方重複建立。”儘管免費使用者的成長推高了成​​本,壓低了毛利率,但OpenAI計畫到2030年透過購物或廣告等新功能創造約五分之一的總收入。上周一,OpenAI宣佈推出針對ChatGPT使用者的個人購物助手,未來或可透過廣告或佣金來獲利。 (創新觀察局)
AI泡沫要破?巨佬顛覆認知的觀點來了!
大模型的決戰越來越激烈了!Google的崛起令OpenAI感到恐懼,並醞釀新的大動作!OpenAI直接拉響警報,推遲賺錢的廣告業務,也要把所有資源梭哈到ChatGPT的改進上。現在的AI圈子,像是星球大戰前夜,由於恐懼,每個人都把手指扣在了扳機上。兵荒馬亂的年代,蔡崇信在香港大學爐邊對話中,拋出了非常反直覺的觀點:現在美國人定義誰贏得AI競賽的方式,純粹是看大型語言模型,我們不看美國定義的AI競賽。當所有人都在盯著誰的模型參數大、誰的算力強時,蔡崇信卻認為——勝負手根本不在這裡。如果不看模型,這場兆賭局的贏家到底看什麼?中國手裡到底還有沒有牌?看完發現,原來大佬眼裡的世界,和我們看到的完全不一樣。1中國AI的真正優勢現在美國矽谷大模型怎麼算輸贏?很簡單:看誰的“大語言模型”更強、更聰明、參數更多。今天是OpenAI遙遙領先,明天Anthropic發個新版本追平,後天Google又搞個大新聞。大家都在卷模型,彷彿誰的模型智商高了一點,誰就統治了世界。但在蔡崇信看來,事實未必如此。他在演講中說了這麼一句極具穿透力的話:"The winner is not about who has the best model. The winner is about who could use it the best in their own industries, in their own lives."(真正的贏家不是誰擁有最好的模型,而是誰能在自己的行業、自己的生活中把它用得最好)這句話什麼意思?打個比方。如果這是一場賽車比賽,美國人現在拚命在比誰的發動機馬力大。但蔡崇信告訴你,贏家不是那個造出萬匹馬力發動機的人,而是那個能把發動機裝進車裡、開著車去送貨、去載客、去賺到真金白銀的人。這個判斷的底層邏輯是:AI的真正價值在於滲透率。中國國務院的AI規劃就體現了這一務實思路——到2030年,AI智能體和裝置的普及率達到90%。中國憑什麼能普及得更快?蔡崇信列出了幾個核心底層邏輯。我們總擔心晶片被卡死,但蔡崇信告訴我們:決定勝負的,是那些基礎到你根本不會關注的領域。1.被低估的電力成本AI訓練和推理,本質上是在燒電。中國的電力成本,比美國低40%。為什麼?中國的國家電網每年投入900億美元的資本支出,而美國只有300億美元。電費低40%,意味著AI應用成本可以大幅低於對手。這是最基礎、最硬核的AI能源優勢。2.建造資料中心的成本低60%在中國建造資料中心的成本要便宜60%,這還不包括購買晶片、廉價GPU的成本。3.工程師紅利晶片可以封鎖,但人才你鎖不住。全球範圍內,幾乎近一半的AI科學家和研究人員擁有中國大學的學位——無論他們在美國公司、中國公司還是世界任何地方工作。蔡崇信說在最近剛看到一個社交媒體帖子,一個在Meta工作的非華裔員工抱怨說,他所在的AI團隊每個人都在說中文,用中文交流想法,他聽不懂。這意味著很多想法的分享和交流在全球AI領域正在用中文進行。這是第一次,中文成為一種優勢!現在,懂中文在AI世界變成了一個優勢。4.最反直覺的優勢:匱乏,逼出內功這是最讓人熱血沸騰的一點:缺乏頂級GPU,反而創造了“飢餓優勢”。美國人資源充足,程式碼寫得爛一點也沒關係,硬體能扛。但中國團隊呢?硬體受限,就必須在系統層面、演算法層面做到極致最佳化,把效率摳到最高。蔡崇信特別點名了爆火的DeepSeek。他說這就是被逼出來的奇蹟。2開源為什麼會贏?蔡崇信還給出了一個對未來的深度判斷,也是這場演講的重中之重。蔡崇信相信中國公司對待大語言模型的方法——即開源——將加速AI的採用,並將真正實現AI的普及,從而使更廣泛的社會受益。開源如此重要的原因是,它成本低廉,使用開源模型實際上不花一分錢。AI的未來,是像OpenAI那樣搞“黑箱子”(閉源),還是像阿里、Meta那樣搞開源?蔡崇信斬釘截鐵:開源模型,將擊敗閉源模型。為什麼?不是因為開源技術更先進,而是因為它更懂人性。他舉了一個極其生動的例子:假設你是沙烏地阿拉伯的國王,你想發展自己國家的AI,你有兩個選擇:用OpenAI的API:你得付一大筆錢,把你的資料傳給美國公司。然後呢?你不知道他們怎麼處理你的資料,你也不知道這模型裡面有什麼貓膩。這就是一個Black Box(黑箱)。用開源模型(比如阿里的Qwen):你直接下載程式碼,部署在你自己的私有雲上。免費,而且資料不出國門,完全可控。這就叫"主權AI",意思是它是我們自主開發的AI。在全球地緣政治這麼複雜的今天,誰願意把命脈交到別人手裡?無論是政府還是大企業,只要稍微算一下帳,稍微考慮一下安全,都會傾向於開源。開源模型有三大殺手鐧:成本、主權、隱私。這三座大山,是閉源模型很難跨越的。3AI時代,普通人該如何應對?蔡崇信給了三條極具實操性的建議,特別是關於“學什麼”,他的觀點顛覆了很多人的認知。1.提出正確的問題比回答更重要在技能方面,蔡崇信認為要學習如何獲取知識,學習如何分析和思考,還有一個重要的技能是提出正確的問題。以前我們上學,老師獎勵那些能快速回答問題的人。但在AI時代,回答問題是機器的事,機器的知識庫比你大多了。蔡崇信強調:"Asking the right question is more important than finding the answer." (提出正確的問題,比找到答案更重要)你要學會的是如何給AI下指令,如何拆解問題。這叫“Prompt Engineering”(提示工程),這是未來人類的核心競爭力。2.還要不要學程式設計?這是目前爭議最大的話題。輝達的老黃說“以後沒人需要學程式設計了”,對著手機說話就行。蔡崇信反對這個觀點。他說:要學!必須學!但他給出的理由:"The purpose is not to actually operate a machine. The purpose is going through that thinking process."(目的不是為了去操作機器,而是經歷那個思考過程)學程式設計,不是為了讓你去寫程式碼(那活兒AI幹得比你好),而是為了訓練你的邏輯思維。甚至,他建議大家去學好Excel電子表格。為什麼?因為你要把一個複雜的公式寫對,讓數字自動跑出來,這本身就是一種嚴密的邏輯訓練。你要訓練的是腦子,而不是手速。3.選什麼專業?如果你的孩子現在要上大學,蔡崇信推薦了三個方向:資料科學:其實就是統計學的升級版。未來是資料爆炸的時代,世界越數位化,你或公司獲取的資料就越多,理解如何管理和分析資料非常重要。心理學和生物學:在做了資料之後,你還想觸及人性的一面,心理學的研究很重要。心理學和生物學幫助你理解人腦是如何工作的,它仍然是最高效、最節能的"機器",理解大腦如何工作非常重要。材料科學:現在很多孩子不學電腦科學,而是在學材料科學。未來世界正被位元(數字資訊)主導,但未來讓位元移動更快的是原子(物理材料)。理解原子如何工作將會非常重要,人們製造半導體,未來半導體領域將會有很多創新。所以材料科學將是一個有趣的學習方向。4AI是泡沫還是未來?AI是否是下一個網際網路泡沫?蔡崇信的回答很哲學,關於泡沫,他認為有兩個概念:真正的泡沫和金融市場泡沫。金融市場泡沫:不知道是否存在金融市場泡沫,因為股票估值更像一門藝術。即使有既定的理論,你可以給一隻股票50倍的市盈率,因為你認為增長率非常高,這合理嗎?我不知道,可能存在與AI相關的金融市場泡沫。技術泡沫:AI現像是真實的。人們正在建造的所有基礎設施,投入到模型開發中的所有研發資源,都不會浪費,因為這是一個真實的現象。就像網際網路一樣,在2000年3月左右,網際網路泡沫破裂了,那是金融市場泡沫破裂,但今天的網際網路就在這裡,事實上網際網路現在更強大,所以技術本身不是泡沫。蔡崇信的這次演講,給人最大的感受是,這場比賽才剛剛開始。這不是一場百米衝刺,看誰起跑快;這是一場馬拉松,看誰能把技術真正融入到這片土地的每一個角落,看誰能用更便宜的電、更務實的態度、更開放的胸懷,去擁抱這個未來。"Focus on the application, not just the model."(關注應用,而不只是模型)這,或許才是中國AI破局的真正答案。對於個人來說,也許在未來,AI將成為成為我們的夥伴。正如蔡崇信所言:AI的下一個重大轉變是當人們開始不再僅僅將AI視為工具,而是作為朋友。現在AI似乎更像一個工具,我們都想用它來讓自己更高效,讓公司更高效。AI已經在幫助我們編碼,所以我們不需要那麼多軟體工程師。但是,AI何時能成為你的夥伴?那時,如果大多數人開始像對待另一個人一樣看待AI,那將真正改變世界,改變行為。有時想想這很可怕,但我看到這正在發生。 (ETF進化論)
ChatGPT發佈屆滿三年:AI 戰場升溫 競爭對手迅猛追趕
自 2022 年底 ChatGPT 橫空出世,全球掀起一波波 AI 熱潮延燒至今。如今 ChatGPT 每周活躍使用者突破 8 億、滲透九成《財富》500 強企業,其開發商 OpenAI 估值也攀升約 5,000 億美元。然而在巨額投資壓力與 Google、Anthropic 以及中國DS、阿里巴巴的競爭下,OpenAI 的領先地位正面臨前所未有的挑戰。►ChatGPT三年發展快速2022 年 11 月 30 日,OpenAI 推出一款能以對話形式互動的模型,名為「ChatGPT」,可在在 chatgpt.com⁠ 試用 。5 天後,註冊使用 ChatGPT 的使用者達到 100 萬人;2 個月後,ChatGPT 成為有史以來成長最快速的消費級應用程式之一。如今 ChatGPT 屆滿三周年,根據 OpenAI 資料顯示,ChatGPT 每周活躍使用者超過 8 億,同時還在不斷增長,超過 90%《財富》500 強企業以某種形式使用 OpenAI 的技術。近來一次股份出售交易過後,OpenAI 公司估值達約 5,000 億美元,被廣泛認為是歷史上最有價值的初創公司。OpenAI 在2025年更與 NVIDIA、甲骨文、AMD、博通等公司達成巨額合作,承諾未來 8 年投入合計 1.4 兆美元建構算力。這個規模遠遠超過 OpenAI 目前的營收能力,需要這些合作夥伴以負債方式投入AI 基礎建設,OpenAI 同時也要找出夠大夠多的收入來源,以支撐如此驚人的投資。市場擔心這是一筆相當大的賭注。OpenAI 2025年收入預估在150億美元左右。►OpenAI領先優勢受到強力挑戰雖然,ChatGPT 現在每周活躍使用者超過 8 億,在整體 AI 聊天機器人的市佔領先,但現在卻承受自 ChatGPT 推出以來的最大壓力,一方面美國國內 Google、Anthropic 等競爭對手急起直追。而在中國,ChatGPT更是遭遇了有著龐大應用市場支援的DS、阿里等強勁對手。Gemini 3VSChatGPT 5.0在美國,根據網站分析工具 SimilarWeb 資料顯示,現在人們花更多時間與 Gemini 對話,而非 ChatGPT。一年前,許多人認為 Google 欲振乏力的 Gemini 恐怕無法縮短與 OpenAI 之間巨大的差距,同時市場擔心作為營收來源的 Google 搜尋引擎版圖,會被 ChatGPT search、Perplexity 等 AI 搜尋服務蠶食,使得母公司 Alphabet 在 2023 年至 2024 年的股價遠遠落後其他科技巨頭。但 Google 在今年稍早展開反攻,5 月開發者大會上信心滿滿的一系列更新,加上今年夏季圖像生成模型 Nano Banana 受關注,助攻 Gemini 手機版的每月活躍使用者從 5 月約 4 億人提升至 6.5 億人。日前釋出新一代 Gemini 3 模型,同時圖像生成進階版本 Nano Banana Pro 的能力大躍進,背後還有 TPU 以及相關技術提供算力支援。此外,更關鍵的是在 2025 年底的佈局中,Google 積極推動將 Gemini 深度整合進 Android 系統的核心層,這意味著 AI 將不再只是一個需要下載、登錄的 App,而是手機的基礎設施。這些進展推動 Alphabet 股價近幾個月大幅上漲,市值首次逼近 4 兆美元。華爾街愈來愈有信心,認為 Google 能依靠在搜尋引擎、雲端基礎建設及智慧型手機終端的關鍵地位,將 AI 新能力提供給全球數十億使用者。除 Google 外,還有 Anthropic 也與 OpenAI 競爭,同樣值得關注。這家前 OpenAI 員工自 2021 年創立,估值預期將會超過 3,000 億美元的初創公司,已建立一個龐大且快速成長的企業客戶業務。業界人士認為,Anthropic 長期聚焦 AI 安全性,所打造的 Claude 模型在企業市場更可靠,加上編碼工具普遍被視為業界最佳。因而,近日,摩根士丹利的分析指出,隨著硬體端的 AI 整合成為趨勢,沒有掌握硬體入口與作業系統的 OpenAI,面臨著被邊緣化為單純「後端模型供應商」的風險。中國對手更是急追猛超而在一直與美國激烈競爭的中國,ChatGPT也遇到了DS、阿里通義千問等的追趕甚至是超越。據最新報導, DeepSeek 再度加速技術迭代,於2日宣佈推出 DeepSeek-V3.2 與 V3.2-Speciale 兩款模型。公司指出,新版本在多項推理基準測試中的表現已可與 OpenAI GPT-5 旗艦模型相匹敵,並首次將「思考模式(thinking mode)」與工具使用深度整合,成為其下一代 AI 助理(AI agent)策略的核心佈局。另一中國科技巨頭阿里巴巴在過去一年裡不僅推出了Qwen大型語言模型系列,還發佈了一款與ChatGPT直接競爭的消費級App Qwen,能直接嵌入阿里巴巴旗下的購物、導航、線上支付等龐大且成熟的應用宇宙。相較之下,與中國這引起應用相比,ChatGPT多數情況仍是獨立產品,與消費者的生活應用場景連結有限。綜上所述,雖然,ChatGPT 已改變全球科技版圖,而 OpenAI 必須在創新速度、算力需求及大環境競爭之間找到平衡點,才能在下一階段的 AI 競賽保有重要位置。 (芯聞眼)