#OpenAI
這家公司,81%的老美沒聽過!
【新智元導讀】2025年,AI像空氣一樣無孔不入,可我們卻越來越不敢呼吸。一份跨越全美的民調戳破了科技繁榮的假象:在高效的背面,是藍領的倒計時和白領的盲目。當「跑贏對手」不再重要,我們該如何守住身為人的最後那份解釋權?過去20年,那些影響深遠的技術,電視,電腦,網際網路,智慧型手機都指向同樣的結局:被驚嘆,被接納,被依賴,直到如同呼吸一般理所當然。但這一套邏輯,放在AI身上卻行不通了。它在極短的時間裡滲透進我們的生活,可始終沒贏得我們的信任。美國公眾對AI重要性的判斷。多數人將AI視為與智慧型手機相當的重要技術,而非蒸汽機、電力等「文明級」基礎設施。AI在人們的認知裡,既不像網際網路,也不像智慧型手機,反倒像一種新型的社交媒體——高效,粘人,以及......威脅。美國公眾對不同技術整體社會影響的淨評價對比。AI的整體好感度明顯低於網際網路與智慧型手機,更接近社交媒體人們從對技術的狂熱中抽身,第一次認真地審視這位「新朋友」:我們真的要把未來,全盤託付給AI嗎?先用,再理解:AI正在變成新的「黑盒中介」很多人都用AI,但真正懂它的人,遠比想像的少。這並不是某些科技公司的年度總結,而是來自Searchlight Institute的一份全國性民調。比起模型性能,調查者更關心一些實際的問題:當AI真正進入生活,人們如何看待它?為什麼感到不安?調查結果很扎心:接近一半的受訪者認為,像ChatGPT這樣的工具只是在「翻資料庫」,或者是照著某種預設的指令碼回答。工具與公司之間的認知斷開。ChatGPT家喻戶曉,但仍有四成以上的人從未聽說過OpenAI;像Anthropic這種處於核心技術圈的公司,八成以上的人完全沒聽過。美國公眾對主要科技公司的認知對比。與Google、Amazon等傳統科技公司相比,AI公司仍處在大規模「認知空白」中。先使用,再理解,這是一種十分危險的「邏輯倒置」。當我們把查證、篩選、總結這些環節交給AI,卻並不清楚它如何運作、依據什麼做判斷、又在受誰影響時,權力的天平已經悄悄傾斜。報告中有一個細節:AI正在成為一種新的「資訊中介」。越來越多的人不再直接觸碰原始資訊,而是習慣於先看一眼由模型生成的摘要、排序和解釋。這意味著,無論是公共議題還是健康資訊,在我們看到之前,其實已經被AI 「加工」過了。當這種過濾成為一種潛移默化的習慣,問題就不僅是資訊來源準不準確,而是——我們看到的,是真實的世界,還是AI編造出的世界?同一項技術,不同的生存直覺在調查中,白領群體對AI的接納度更高。他們熟練地將其接入寫作、整理與分析的流程。對他們而言,AI是生產力的加速器,是效率的延伸。但在服務業與體力勞動者的視野裡,看法完全相反。超過一半的服務業從業者認為,AI終將取代他們當下的生計。他們從不糾結模型的好壞,也不關心版本的更迭,他們只在意——這個系統,是在幫我,還是在瞄準我。這恰恰是這份調查最殘酷的地方。AI製造的分裂,從來不是會不會用,而是身處不同位置時的生存直覺。對白領來說,AI替他們承擔著瑣碎且低風險的雜務;但對服務業者而言,AI會侵佔那些標準化的、可複製的、容易被資料衡量的勞動。美國AI使用者的主要使用場景。當前AI更多被用於資訊獲取、文字處理等認知型任務,而非直接介入現實生產勞動。同一項技術,一邊看到的是效率提升,一邊看到的卻是失業倒計時。美國公眾對AI與工作的關係判斷。這種擔憂,並不只存在於某個行業。大多數的美國人相信AI會取代工作,而不是補充工作。這種恐懼也並非平均分佈。在調查中,醫生、電工、維修工人對「被取代」的擔憂明顯更低。因為他們深知,真實的物理世界充滿了模糊的情境與未知的現場,這是目前的演算法難以踏足的禁區。在那些關乎生死的瞬間,人類無法將「道德責任」轉嫁給一段程式碼。AI可以處理海量的資料,卻無法做出「該不該」的抉擇;它能給出精準的建議,卻無法為最終的後果負責。在這條無形的裂縫之上,AI不僅是進步的象徵,它更像一面照妖鏡,冷冷地照出了職業與階層之間,那份本就不對等的風險承擔。2025的轉向:速度,不再是最高價值在「該怎麼辦」這件事上,人們的態度出奇地一致。超過三分之二的受訪者認為,政府目前對AI的監管實在太少了。這不是要求公司按下暫停鍵,更不是要封殺技術本身,而是一種明確的價值取向:AI可以繼續發展,但前提是,它必須被測試、被約束、被追責。真正耐人尋味的,是那道關於「速度與安全」的選擇題。當「監管可能導致在國際競爭中落後」這個尖銳的籌碼被擺上桌面時,大多數受訪者依然沒有動搖。相比於「不受限制地領跑」,他們更願意接受一個雖然更慢、但更安全的版本。這是一次極其清晰的敘事反轉。長期以來,技術進步總被包裝成一場不能停下的軍備競賽——慢一步就會被超越,猶豫一下就會被淘汰。但在AI這件事上,普通人開始意識到:贏得比賽的獎勵,與失敗後要承擔的後果,往往並不是同一群人。在涉及國際競爭的前提下,美國公眾仍明顯傾向於優先制定AI的安全與隱私規則。如果勝利的代價是工作的動盪、隱私的暴露,判斷權的讓渡,那麼即便技術指標遙遙領先,這種勝利也無法讓人感到安寧。美國公眾對AI風險的主要擔憂及監管優先順序。多數關注集中在就業、隱私與資訊秩序等現實層面。調查中還有一個更極端的假設:在「完全不受監管的AI」與「乾脆禁止發展」之間,多數人並沒有投給前者,甚至陷入了長久的遲疑。這種遲疑本身就是一種表態。公眾不再迷信「技術越快越好」,他們正在權衡風險是否已經逼近了個人生活的底線。不是所有決定,都該交給演算法在這份調查裡,人們表現出的並不是盲目排斥。相反,大家對AI的認知相當清醒。它確實更高效、更快,也更擅長處理那些規則明確的事務。但當問題開始變得模糊,當後果需要被具體的某個人承擔,當判斷牽涉到複雜的價值取捨時,信任並沒有盲目地向技術傾斜。這也是為什麼,在「道德」、「複雜決策」與「透明度」這些維度上,人類依然被視為不可替代。AI可以給出看似完美的答案,但它並不生活在答案帶來的後果裡。所謂的防線,也不是要阻擋技術的浪潮,而是要守住判斷的權力,責任的鏈條,以及對錯誤最起碼的承擔。當資訊開始被演算法過濾,當工作被系統重構,當越來越多的決策發生在我們看不見的「中間層」,人類真正需要保護的,是那份對世界的解釋權:誰有權做決定,誰又必須為這個決定負責。這也讓2025年顯得格外不同。在這一年,人們開始停下來問:在AI走得更遠之前,我們有沒有把那道屬於人的邊界,畫得足夠清楚。 (新智元)
Fortune雜誌─AI的千億賭局:帝國基石還是紙牌危樓?
將OpenAI比作一座正在建造的房屋或許並不貼切——因為沒人能確定這座“建築”究竟用什麼材料支撐。但可以肯定的是,這是一項燒錢到令人咋舌的工程。據報導,OpenAI正以7500億美元估值尋求新一輪融資,金額高達數百億美元,其中亞馬遜計畫投資100億美元(編者註:亞馬遜作為科技巨頭,此次押注凸顯其對AI基礎設施的長期看好)。公司正瘋狂投入算力,在為AI晶片供電的資料中心澆築混凝土。OpenAI表示,必須繼續堆砌這座由模型與應用組成的“金字塔”——目前已有超8億使用者依賴其服務。OpenAI首席執行長薩姆·奧特曼(Sam Altman)。圖片來源:Kyle Grillot/Bloomberg via Getty Images但如此高昂的成本,既讓人驚嘆,也引發深切憂慮。業界觀察者形容OpenAI的擴張如同帝國大廈拔地而起,預算增速甚至比建築物本身更快(編者註:真實的帝國大廈按今日價格計算僅耗資約7億美元,且未超預算)。一些懷疑論者直言,這整片“建築群”或許只是一座傲慢的紀念碑,隨時可能轟然倒塌。我的觀點是:若將OpenAI視為一座房屋,它尚處於建設初期——但沒人知道地基究竟牢靠與否。其計畫固然雄心勃勃,目標直指前所未有的高度。但這究竟是紙牌搭成的危樓?還是搖搖欲墜的木柱小屋?抑或堅固的混凝土大廈?核心問題在於:無論最終形態如何,它能否承受已壓在肩頭的重量?專家觀點分化這種不確定性讓我採訪的專家們意見分歧。科技分析師羅布·恩德爾(Rob Enderle)表示,希望看到OpenAI能建立在更穩固的基礎上。“如果他們在基礎方面有更強的根基,我會感覺更放心,”他告訴我,特別強調需要讓產品足夠可信,以促進企業客戶的採用。他補充說,OpenAI在方向上曾一度“偏離軌道”,並指出自2023年11月首席執行長薩姆·奧爾特曼(Sam Altman)短暫被解職後復職以來,公司原有的獨立安全和倫理監督結構已被邊緣化。他認為,如今OpenAI試圖同時與所有人競爭;被動應對競爭對手而不是執行清晰的路線圖;在沒有明確優先順序的情況下大量支出。正如《財富》雜誌本周深度報導所披露,OpenAI首席執行長薩姆·奧爾特曼(Sam Altman)兩周前在公司內部拉響“紅色警報”,部分原因在於他意識到公司可能因試圖同時推進過多項目而分散精力。該報導剖析了OpenAI“紅色警報”的背景、方式和內容,還解釋了為何奧爾特曼警告公司要做好面對“艱難氛圍”和經濟逆風的準備,原因是Google和OpenAI競爭加劇。奧爾特曼正試圖激勵團隊在未來幾周內重新聚焦OpenAI的核心ChatGPT產品。但據恩德爾說,這些都是非常被動的,缺乏足夠的戰略性。針對該公司持續發佈新產品——從新AI模型和新圖像生成模型,到網頁瀏覽器、ChatGPT內建購物功能,再到本周剛推出的應用生態系統——同時推進大規模“星際之門”資料中心建設,恩德爾將OpenAI比作網景(Netscape)等網際網路公司,指出這些公司致富過快,失去了戰略紀律。“他們跑得太快,真正關注方向的時間不多,”他說道。然而,其他人強烈不同意這種觀點。Futurum Research創始人兼首席執行長丹尼爾·紐曼(Daniel Newman)告訴我,擔心OpenAI的房屋會倒塌,忽略了大局。“這是一個跨越數十年的超級周期,”他說道,將公司當前AI階段比作Netflix的DVD郵寄時代——這是隨後真正範式轉變的前奏。從未滿足需求和長期價值創造的角度來看,紐曼認為OpenAI在算力方面的巨額投資是理性的,而不是魯莽的。“我認為OpenAI今天擁有的是高品質的、未來三維模擬和建築效果圖,”紐曼說道。他補充說,真正的問題是OpenAI能否獲得足夠的市場份額來建造它設想的豪宅。“我認為OpenAI的真正目標是成為超級規模企業,”紐曼說道。“他們將擁有基礎設施、應用程式、資料、工作流程、智能工具——人們將從OpenAI購買他們現在從其他地方獲得的一切。這是一個非常雄心勃勃的目標。不能說它會成功。但如果成功了,這些數字是有意義的。”粘性難題:是膠水還是釘子?支撐“房屋”的關鍵是什麼?最後,我與高德納諮詢公司首席分析師阿倫·錢德拉塞卡蘭(Arun Chandrasekaran)交流時,他對我“房屋”的比喻笑了笑,雖試圖迴避,但仍願探討OpenAI的基礎是否紮實。“他們發展極快,還做出了任何同等規模公司都未曾許下的巨額承諾,”他坦言,“這本質上是一場風險投資,戰略本身就伴隨風險。”在他看來,一切取決於OpenAI產品的“粘性”——即模型層與應用層能否讓使用者難以離開。“關鍵在於客戶的轉換成本,以及其他因素能否讓增長按預期實現,”他說,“這是一家高增長公司,但市場預期其增速必須比現在更快。期望值非常高。”“粘性?”我追問,“像膠水?還是像釘子?那些支撐房屋的要素?”他笑了:“沒錯——就是膠水。你說的粘性,我說的膠水。”(財富Fortune)
穩准狠!輝達反擊Google和OpenAI
打蛇打七吋這不,黃仁勳著急了,Google和OpenAI一唱一和給輝達挖坑才說完兩天時間,輝達現在就直接跟Groq合作要做TPU了!Groq跟Google的TPU技術相似,不過比Google的脈動陣列核心做得更徹底,直接限制資料不能調整各個方向傳播,單方向流水線架構。加上純一級快取高頻寬,依賴編譯器生成靜態計算圖。結果就是編譯器比Google TPU要更簡單更快。也是產品架構足夠簡單,所以才能最快速度量產商業化。但缺點是不能用來做AI大模型訓練。現在,輝達的反擊快准狠,直接拉到了Groq合作做TPU,也是很有意思!TPU這種AI晶片的核心是,編譯器和靜態計算圖技術,這個編譯器必須適配現在的AI開發生態,還不能太複雜,太複雜的話開發和維運周期太長,可用性低。之前專門解釋過這個事靜態計算圖是如何幫Google Tensor TPU超越輝達GPU性能的?輝達有市場必用的AI軟體框架CUDA,Groq的兩者張量流架構做到了最簡單,兩家高度互補!這兩家合作直接對Google的XLA和OpenAI的Triton直接釜底抽薪!讓兩家軟體優勢一夜之間還沒雄起,就殘血大半。為何Groq晶片性能那麼強?Groq的指令集架構(ISA)非常特殊,它利用了晶片的空間佈局,運算東西向水平移動,處理指令和資料的流動。資料在南北向讀取計算單元。無衝突設計:編譯器確保當MXM單元需要資料時,資料正好在那個時鐘周期通過"傳送帶"到達該位置。編譯器:Groq的真正大腦,架構中,編譯器承擔了所有繁重的工作。在NVIDIA架構中,硬體負責管理資料流(快取未命中,線程調度),計算出每個是在每個時刻的位置。晶片間互聯(C2C):為了讓幾百張卡像一張卡一樣工作,Groq晶片自帶了大量的Chip-to-Chip 引腳,晶片之間直接相連,不需要昂貴的InfiniBand 交換機或 NVLink交換機。對這一部分感興趣的讀者,可以留言點贊,後續再詳細講解。 (AI頓悟湧現時)
Fortune雜誌─OpenAI企業版銷售利潤率提升
2025年2月3日,在日本東京舉辦的“人工智慧推動業務轉型”活動中,OpenAI首席執行長薩姆·奧爾特曼(Sam Altman)與軟銀集團(SoftBank Group)首席執行長孫正義(Masayoshi Son)展開對話。圖片來源:Tomohiro Ohsumi—Getty Images據科技媒體The Information報導,為保持其在人工智慧領域的領先地位,OpenAI今年已成功提升其付費產品的利潤率。報導指出,OpenAI提升了其“算力利潤率”——該內部指標用於衡量扣除企業版與個人付費使用者模型運行成本後的收入佔比。報導援引知情人士稱,截至今年10月,OpenAI的算力利潤率已達70%,高於2024年底的52%,較2024年1月的水平翻了一番。OpenAI發言人回應稱,公司未公開相關資料,且不予進一步置評。OpenAI高管竭力應對AI支出擔憂作為ChatGPT的創造者,OpenAI雖引爆了本輪AI熱潮,卻尚未實現盈利——這對擔憂行業泡沫的投資者而言是關鍵指標之一。去年10月估值達5000億美元的OpenAI,一直在尋找盈利途徑以覆蓋高昂的算力成本,並支撐其宏大的基礎設施計畫。與此同時,公司正面臨支出壓力與競爭加劇的雙重挑戰。在Google(Google)旗下Gemini模型於多項基準測試中表現更優後,OpenAI首席執行長薩姆·奧爾特曼下達“紅色警報”,調動內部資源全力改進ChatGPT,並暫緩了廣告服務計畫的推進。目前大多數使用者仍使用ChatGPT免費版。但OpenAI正積極向金融、教育等行業推廣其企業版與付費軟體功能,從而與Google及競爭對手Anthropic展開較量。The Information報導稱,在付費帳戶的算力利潤率方面,OpenAI優於Anthropic,但後者在伺服器支出的整體效率上更高。OpenAI亦正與亞馬遜(Amazon.com Inc.)進行初期談判,計畫籌集至少100億美元資金並採用其晶片。若交易達成,奧爾特曼領導的這家公司估值有望突破5000億美元。(財富FORTUNE)
【十五五】重塑“視”界:AI視訊產業的戰略崛起與“十五五”發展藍圖
前   言如果說過去十年是移動網際網路重塑資訊傳播方式的十年,那麼站在“十五五”規劃開局之年的我們,正清晰地見證一場由人工智慧驅動的、更為深刻的視聽產業革命。AI視訊生成已從一個前沿概念,急速演進為驅動文化新質生產力、重構數字經濟版圖的核心引擎。從OpenAI的Sora引發全球驚嘆,到國內快手可靈、美圖等產品的快速商業化落地,再到《北京市促進“人工智慧+視聽”產業高品質發展行動方案(2025-2029年)》的率先出台,一個技術、政策與市場共振的產業發展“奇點”已然來臨。本文將深入剖析AI視訊產業的技術核心、市場動態、競爭格局與政策環境,勾勒其如何與國家“十五五”戰略同頻共振,賦能千行百業。一、頂層戰略與政策領航:為產業注入“確定性”任何顛覆性技術的規模化發展,都離不開清晰的國家戰略與穩健的政策框架護航。AI視訊產業正深度融入國家現代化宏偉藍圖,其發展軌跡獲得了強有力的頂層設計支援。國家層面的戰略定位極為明確。2025年9月發佈的《國務院關於深入實施“人工智慧+”行動的意見》(國發〔2025〕11號)是統領全域的綱領性檔案,不再將人工智慧視為孤立技術,而是定位為與經濟社會各領域深度融合、催生新質生產力的核心驅動力。檔案設定了清晰目標:到2027年,人工智慧將在六大重點領域深度應用,新一代智能終端、智能體等應用普及率超過70%;到2030年,人工智慧將全面賦能高品質發展,智能經濟成為重要增長極。這為AI視訊在各行各業的應用普及提供了明確的時間表和廣闊的想像空間。在“人工智慧+”的宏大敘事中,視聽產業因其巨大的文化影響力、經濟價值和民生關聯度,成為率先落地的關鍵領域。地方政府反應迅速,以北京市2025年11月發佈的“人工智慧+視聽PILOT領航計畫”為代表,堪稱一份前瞻性、系統性的產業發展路線圖。該計畫核心是“五位一體”的系統性推進:Platform(技術平台)攻堅垂類大模型;Innovation(內容創新)推動AI在影視、動畫等內容全鏈條應用;Landscape(場景賦能)覆蓋智慧影棚、文商旅體融合等領域;Optimization(服務最佳化)搭建智能體開發等平台;Trust(安全信任)探索“監管沙盒”,建構安全體系。這一方案標誌著發展思路已從單點技術突破,升級為建構技術、資料、平台、應用、安全協同進化的完整產業生態。圖表:國家及地方AI視訊產業核心政策時間軸資料來源:中投產業研究院整理圖表:北京市“人工智慧+視聽PILOT領航計畫”五維協同體系資料來源:政府機構官網、中投產業研究院二、技術突破與範式革命:從“工具”到“世界模型”的躍遷產業爆發的根源在於技術的代際飛躍。AI視訊生成技術在過去兩年完成了從“可用”到“好用”的關鍵跨越,其演進路徑清晰地指向對物理世界理解和模擬的更高維度。技術架構的演進是這場革命的基石。行業早期依賴生成對抗網路(GAN),隨後擴散模型(Diffusion Model)與Transformer架構的結合成為主流。當前,以OpenAI的Sora為代表的擴散型Transformer(DiT)架構成為前沿,它將Transformer的強大序列建模能力應用於擴散過程的潛在空間,從而能夠處理更複雜的時空關係。例如,Sora模型已能生成長達分鐘級、物理邏輯更一致的高品質視訊,這不僅是時長的延長,更是對場景動態合理性理解的質變。可以說,AI正在從“剪輯師”向“導演”進化。技術進步直接體現在產品性能的躍升和成本的陡降上。目前,頂級模型已能支援生成長達數分鐘的4K解析度視訊。更關鍵的是,成本優勢已成為顛覆傳統行業的“殺手鐧”。根據行業權威分析,目前國內外主流AI視訊生成API的單秒成本已降至0.2至1元人民幣區間。相比之下,傳統視訊製作成本呈幾何級數差異:本土電視廣告(TVC)視訊製作成本約在千元級/秒,而頂級動畫電影的製作成本甚至高達十萬元級/秒。這種千百倍的成本差異,為視訊內容的大規模、個性化生產掃清了經濟障礙。圖表:AI視訊生成技術演進路線圖資料來源:中投產業研究院圖表:AI視訊生成與傳統視訊製作成本對比柱狀圖資料來源:中投產業研究院三、市場爆發與競爭重塑:全球格局下的中國力量在技術與政策的雙輪驅動下,全球AI視訊市場正以驚人速度擴張,中國不僅成為最重要增長極之一,更在技術和商業化層面湧現出具有全球競爭力的參與者。全球市場規模與增長前景廣闊。根據Fortune Business Insights的預測,全球AI視訊生成器市場規模預計將從2025年的7.168億美元增長至2032年的25.629億美元,年複合增長率高達20%。亞太地區是增長最快市場,年複合增長率預計達23.8%,中國是主要驅動力。市場增長的底層動力是視訊在全球數字內容消費中佔據主導地位(據Cisco VNI預測,視訊已佔全球移動網際網路流量的70%以上)以及AI帶來的生產效率革命。競爭格局呈現多元化態勢,中國力量表現亮眼。海外廠商如Runway、OpenAI (Sora)在技術和創意社區影響力方面領先。據報導,Runway在2024年12月的年度經常性收入已達8400萬美元,顯示出強勁的商業化勢頭。與此同時,中國廠商如快手可靈(Kling)、美圖、字節跳動的剪映即夢等產品已躋身全球第一梯隊。在商業化上,中國廠商展現出更快速度和更靈活策略。例如,快手可靈(Kling)在2025年初實現了顯著的商業突破,年化收入運行率迅速攀升,凸顯出國內市場的巨大潛力和強大的商業化能力。此外,國內產品通常具有更優的性價比,降低了使用門檻,加速了技術在中小企業和個人創作者中的普及。圖表:全球AI視訊生成器市場規模預測折線圖(2025-2032)資料來源:Fortune Business Insights、中投產業研究院圖表:全球主要AI視訊模型性能與商業化對比氣泡圖資料來源:麥肯錫、BCG、中投產業研究院四、應用賦能與產業融合:催生“智能原生”新業態AI視訊技術的真正價值在於其作為“基礎能力”與千行百業融合後催生的“化學反應”,正在重塑從內容創作到產業營運的完整價值鏈。首先是內容產業自身的工業化升級。 AI已能深度參與劇本構思、分鏡生成、視訊生成與剪輯的全流程。這催生了如“AI漫劇”等新形態——以漫畫或小說IP為基礎,通過AI快速生成統一風格的動態短影片,極大縮短了IP視覺化周期。對於影視動漫行業,這意味著能夠以更低成本、更高效率進行“大規模個性化內容生產”。其次是賦能實體經濟,創造沉浸式體驗與增長新動能。在電商與零售領域,AI生成的個性化商品展示視訊能顯著提升轉化率。據Adobe Digital Insights報告,採用高品質視訊素材的電商頁面點選率可比圖文高出30%以上。在文旅與教育領域,通過AIGC技術對文物古蹟進行活化宣傳,可以打造沉浸式歷史文化體驗。在工業與科研領域,AI生成的高擬真視訊可用於自動駕駛演算法訓練和科學可視化,加速創新處理程序。最終,所有應用將匯聚於“智能終端”的革新。未來的AI電視、AI手機、AI眼鏡乃至智能汽車,將不再是簡單的播放裝置,而是具備本地化即時生成、理解和互動視訊內容能力的“智能體”。圖表:AI視訊在重點行業應用效果對比圖資料來源:中投產業研究院圖表:AI視訊賦能產業生態全景圖資料來源:中投產業研究院五、未來挑戰與核心關切:在創新與治理中尋求平衡前景雖廣闊,但邁向成熟的產業必須清醒應對挑戰。這些是“十五五”期間政策與產業界需共同攻克的核心議題。技術瓶頸與工程化鴻溝依然存在。當前AI生成視訊在複雜敘事邏輯、長程時序一致性上仍存不足,從生成單段視訊到支撐完整工業化工作流,仍需大量工程化創新。資料、算力與成本約束是產業可持續發展的關鍵。高品質、合規的視聽資料集建設挑戰巨大,同時大模型對智能算力的需求持續攀升。版權、倫理與安全風險是監管與產業發展的核心交匯點。 AI生成內容的智慧財產權歸屬、深度偽造技術濫用等風險亟待規範。北京方案中提出的“監管沙盒”機制正是前瞻性佈局。此外,既懂AI演算法又精通視聽藝術的複合型“智匠”人才短缺,也制約著產業發展。總而言之,AI視訊產業已告別野蠻生長期,步入與國家級戰略深度融合、在規範中加速創新的新階段。中國的獨特優勢在於統一的頂層戰略、豐富的應用場景、快速迭代的工程化能力以及積極審慎的治理框架。抓住這一機遇,不僅能培育兆級智能經濟新增長極,更將在建構數字時代文化軟實力和國際競爭新優勢中,佔據戰略制高點。這場由AI掀起的視覺革命,畫卷剛剛展開,其波瀾壯闊的未來,正待我們共同書寫。 (中投未來產業研究中心)
奧特曼的“帝國隱憂”:多線擴張,正在拖慢ChatGPT
過去一年,一個令人費解的現像在OpenAI內部蔓延:即便ChatGPT推出了能在國際數學奧賽摘金、在頂級程式設計競賽奪冠的“最強大腦”,但普通使用者們似乎並不買帳。圖片由AI工具生成據外媒報導和OpenAI 9月發佈的資料顯示,多數使用者使用ChatGPT可能只是詢問相當簡單的問題,根本無需動用那些耗費巨大計算資源、需要“思考”半分鐘的推理模型。這一刺眼的資料,指向了OpenAI在巔峰之下隱藏的深刻危機:一場由CEO山姆·奧特曼親自推動的戰略擴張正引發嚴重的深層危機,包括組織架構割裂、多線作戰導致資源分散,以及技術路線與使用者需求嚴重脫節,這正將其王牌產品ChatGPT拖入競爭泥潭。01核心矛盾:前沿研究與大眾需求的“性能過剩”鴻溝OpenAI的核心矛盾,根植於其研究部門與產品團隊日益擴大的目標分歧。公司內部一個超過千人、相對獨立的研究團隊,近年來將重心押注在追求“推理模型”和“通用人工智慧”(AGI)這一終極目標上。這種模型雖然能在複雜數學和科學問題上表現出色,但其代價是高昂的計算成本和緩慢的響應速度,處理一個問題可能需要數秒甚至數分鐘。然而,這與ChatGPT數億主流使用者的需求嚴重脫節。AI評估機構LMArena負責人彼得·戈斯特夫所言,“OpenAI 把重心放在‘科學、數學基準測試、前沿數學、程式設計競賽’上,但這似乎並不匹配典型的 ChatGPT 使用者”,他指出,“大多數 ChatGPT 使用者問的可能只是一些非常簡單的問題,比如電影評分、日常諮詢,“根本不需要模型思考半個小時”。這種“性能過剩”直接導致了產品層面的挫折。2025年初,當OpenAI試圖將最先進的推理模型轉化為ChatGPT可用的版本時,其性能反而“意外地變差”了。即使後來以“思考模式”等形式嵌入,在近9億周活躍使用者中,也僅有極少數人頻繁使用。更令人尷尬的是,OpenAI內部發現,就連傳統的非推理模型,在整合到ChatGPT產品時,也可能因與“個性化”等功能的衝突而導致性能下降。圖:從左到右依次為OpenAI應用部門CEO菲吉·西莫、CEO奧特曼以及首席研究官馬克· 陳02多線作戰:奧特曼的“帝國野心”與ChatGPT的資源內耗在核心產品面臨使用者體驗鴻溝的同時,奧特曼卻開啟了一場令人眼花繚亂的“多線作戰”。在ChatGPT之外,他同時推進了包括Sora視訊生成、音樂AI、AI網頁瀏覽器、AI智能體、消費級硬體裝置、機器人等一系列雄心勃勃的項目。這些平行推進的新項目,持續分流了原本應集中投入在 ChatGPT 上的關鍵資源。多位 OpenAI 研究人員證實,一些新方向的展開,客觀上削弱了用於提升 ChatGPT 大眾化吸引力的投入強度。結果出現了一個頗具諷刺意味的局面:在外部競爭愈發激烈的同時,OpenAI 最核心的收入引擎,卻在內部資源博弈中逐漸“失血”。即便是負責應用與產品線的首席執行長菲吉·西莫,也不得不坦言,在 OpenAI,“產品本身並不是終點”。這家公司在文化與決策層面,依然深受“研究優先”的基因所主導。這種戰略分散在應對Google的兇猛反撲時顯得尤為危險。Google憑藉其龐大的產品生態(Gmail、Chrome、YouTube等數十億使用者入口),正在將AI能力無縫融入使用者已有的工作流中。 正如分析師所言,使用者轉向Gemini“不僅僅是因為它模型更好,而是發現這種能力已經融入一切”。相比之下,ChatGPT在很大程度上仍是一個需要使用者主動訪問的獨立工具,面臨巨大的使用者習慣遷移成本。OpenAI在圖像生成功能上的搖擺,是內部戰略不協調的縮影。2025年早些時候,公司一度降低了圖像生成的優先順序,直到8月Google發佈引爆流行的Nano Banana圖像生成器後,才倉促重新聚焦。據員工透露,這甚至引發了奧特曼與研究主管馬克·陳之間的分歧。這種“追趕式”反應,暴露了多線作戰導致的決策滯後和被動。03增長悖論:使用者增速放緩與商業變現的競賽OpenAI正面臨一個關鍵的增長拐點。該公司在年初設定了年內達到10億周活躍使用者的宏大目標,但截至12月初,其使用者數“不足9億”,且顯示其使用者增長正在顯著放緩。然而,與使用者增長放緩形成鮮明對比的是,OpenAI在商業化變現方面取得了驚人進展。其年化收入從1月份的60億美元激增至目前的超過190億美元,主要動力來源於個人和企業使用者的訂閱。這一財務表現使其有望實現8月份設定的年底200億美元年化收入的目標,並超越其2025年130億美元的收入預期。基於此,該公司正尋求以7500億美元的估值進行融資,該估值較兩個月前高出50%。圖:在每100名ChatGPT的周活躍使用者中,約有5人付費訂閱其Pro或Plus服務不過,要實現OpenAI為2030年規劃的2000億美元收入願景,該公司必須將周活躍使用者轉化為日活躍使用者,以創造更多變現機會。這包括銷售計畫中的廣告,或從聊天機器人促成的交易中抽成。圖:OpenAI預計2030年收入將達到2000億美元儘管OpenAI發言人稱ChatGPT已佔據全球助手使用量的約70%,並成為蘋果應用程式商店年度下載量最大的免費應用,但其增長模式已顯現出深層矛盾:商業化成功可能以使用者增長放緩為代價。專注於從現有使用者獲取高額訂閱收入的策略,可能正在損害其使用者基礎的進一步擴大。並且,隨著GoogleGemini等競爭對手在使用者規模和生態整合上快速推進,OpenAI若不能有效解決使用者增長停滯的問題,其短期亮眼的財務資料背後,可能隱藏著觸及市場天花板的長遠危機。04競爭圍剿:Google的反擊與生態劣勢關於ChatGPT能否取代Google搜尋,當前的看法與一兩年前的主流預期已形成鮮明對比。當時,無論是OpenAI還是Google的高管都曾相信,ChatGPT能夠有效替代傳統搜尋引擎。然而,此後Google迅速在搜尋結果頂部整合了AI生成的答案摘要。據該公司2023年10月報告,這一功能正在推動“有意義”的搜尋量增長和收入提升,因為“使用者逐漸意識到,Google能夠解答更多類型的問題”。Google在其他方面的反擊也足夠精準和致命。2025年,其Gemini實現了快速增長:月活使用者從7月的4.5億增至6.5億,網站存取量單月增長14.3%,而ChatGPT同期訪問量卻連續兩月下降。更關鍵的是,Gemini的平均訪問時長自9月起已超越ChatGPT。Google的成功不僅源於模型性能。其Nano Banana Pro圖像生成器因能生成“可讀且上下文相符的文字”而風靡社交網路,而Gemini 3在複雜商業問題、寫作和編碼上的表現贏得了廣泛讚譽。分析師指出,使用者轉向Gemini“不僅僅是因為模型更好,而是發現這種能力已經融入一切”。圖:Google模型Nano Banana生成的圖片相比之下,OpenAI的生態劣勢明顯。前員工警告,如果Google在原始性能上實現超越,甚至免費提供Gemini,可能同時扼殺OpenAI的API和消費者訂閱業務。OpenAI雖然通過迪士尼合作和聘請蘋果前設計主管喬尼·艾維來建構生態,但硬體裝置“兩年內”才能面市,時間窗口正在縮小。05下一次“紅色警報”或撞上蘋果面對危機,奧特曼在12月拉響了“紅色程式碼”警報。他明確要求將資源重新集中到ChatGPT及其推理能力等核心基礎之上,並推遲了廣告、擴展電商等短期盈利項目。他希望在明年1月底通過一次重大產品更新來扭轉局面。與此同時,OpenAI還迅速推出了一系列應對措施:發佈GPT-5.2(內部代號Garlic),重新奪回多項AI模型性能基準榜首推出新圖像生成模型,回應GoogleNano Banana的競爭回退模型路由系統,讓免費使用者默認使用更快的GPT-5.2 Instant然而,這些措施暴露了更深層的問題。模型路由系統僅運行四個月就被撤回,因為它將免費使用者使用推理模型的比例從不到1%提升至7%,顯著增加了成本,卻因響應慢“對日活指標產生負面影響”。這再次證明,純粹的技術升級未必帶來產品成功。事實上,這並非OpenAI首次拉響“紅色程式碼”警報。首席研究官馬克·陳透露,該公司曾多次使用這一機制,但此次持續時間八周,是“比以往更長”的緊急狀態。此前,該機制曾被用於應對從DeepSeek到Anthropic發佈Claude等競爭威脅。然而,奧特曼的雄心意味著,未來公司可能還將面臨更多需要拉響警報的時刻。當前為期八周的“紅色程式碼”聚焦於應對Google的競爭,但這可能只是更大規模產業衝突的前奏。在鞏固軟體與模型優勢的同時,奧特曼已開始佈局一個更為宏大的硬體戰略,這預示著OpenAI可能與另一個消費電子巨頭蘋果發生直接碰撞。奧特曼對硬體裝置在AI普及中的關鍵作用深信不疑。他公開設定了一個極具顛覆性的目標:開發一款OpenAI裝置,以取代智慧型手機成為人們隨身攜帶的新標準。為實現這一願景,今年5月,他聘請了前蘋果設計靈魂人物喬尼·艾維,並收購了其初創公司,旨在共同打造新一代AI硬體。可以預見,正如Google在軟體層面對OpenAI發起猛烈反擊,蘋果也絕不會在它視為核心的硬體領域坐視挑戰者的崛起。這場即將到來的硬體之爭,將不僅是產品功能的比拚,更是關於下一代人機互動範式的話語權爭奪。06未來迷局:一場尚未結束的生存戰除了技術和產品性能外,OpenAI還面臨著其他方面的挑戰:在財務方面,儘管OpenAI預計其年化收入超過190億美元,但公司正“每年燒掉數十億美元現金”以支付驚人的計算成本。其規劃的1.4兆美元基礎設施投入更是天文數字,迫切需要ChatGPT創造更大、更穩定的現金流。在生態領域,與Google、微軟、蘋果等擁有成熟軟硬體生態的巨頭相比,OpenAI本質上仍是一家“模型公司”。它正試圖通過與迪士尼合作、聘請蘋果前設計主管開發硬體來建構生態,但這需要時間,而競爭對手不會等待。在利潤豐厚的企業客戶市場,OpenAI 似乎也失去了更多市場份額,根據Menlo Ventures近期的一份報告,其份額已降至27%,而Gemini則上升至21%,Anthropic以 40%的份額領先。復盤OpenAI的戰略,其癥結在於:在憑藉技術閃電戰取得先發優勢後,未能將技術優勢高效、專注地轉化為可持續的產品優勢和使用者體驗護城河。 奧特曼同時追逐AGI、硬體夢想和多元產品生態,導致公司在關鍵戰役上兵力分散。而追求極致的“推理”性能,又與大眾市場對“即時、可靠、易用”的核心需求產生了錯配,陷入了“性能過剩”的陷阱。“紅色程式碼”是一次緊急止血和戰略回呼,但ChatGPT的泥潭之路尚未走完。OpenAI需要回答的根本問題是:它究竟是一家以AGI研究為終極使命的實驗室,還是一家以贏得AI產品市場為目標的公司?這道題的答案,將決定它是否能穿越巨頭圍剿的硝煙,守住自己開創的時代。正如矽谷歷史的教訓所昭示的,創新者與老牌巨頭的戰爭,往往贏家通吃,而輸家則只能成為史書中的一個腳註。OpenAI正站在這樣一個決定命運的岔路口。 (騰訊科技)
奧爾特曼點名“AI記憶”,儲存環節迎來新敘事
奧爾特曼表示,“雖然說這是2026年(要考慮)的事,但它是我個人最期待的部分之一。”“這是整個系統裡我個人最期待的部分之一。”在日前的Big Technology訪談中,OpenAI CEO山姆•奧爾特曼(Sam Altman)如此形容記憶功能。在他看來,AI的下一個重大飛躍並非是更敏銳的推理能力,而是更為根本的記憶。ChatGPT問世三年多以來,聊天介面並沒有出現大變動,但底層功能進步不少,其中就包括記憶功能。在訪談中,當被問及“記憶功能究竟發展到什麼程度”時,奧爾特曼表示,“其實我認為我們現在完全無法想像它最終能發展到什麼程度。人類本身是有侷限的:即使你擁有世界上最好的私人助理,他們也不可能記住你說過的每一句話,不可能讀過你的每一封郵件,不可能看過你寫的每一份檔案,不可能每天觀察你的所有工作並記住每一個細節,也不可能以那樣的深度參與到你的生活中——沒有任何人類擁有完美無限的記憶,但AI肯定可以做到這些。”記憶功能是OpenAI內部經常討論的一個問題。目前ChatGPT雖然迭代到了5.2,但記憶功能“依然非常粗糙、非常早期”,仍處於“GPT-2時代”。一旦AI真的能記住你整個人生的每一個細節,並在此基礎上加以個性化——不僅能記住事實,還能察覺、捕捉並利用那些連使用者自己都沒意識到未曾刻意表達過的小偏好,AI將變得極其強大。“我覺得這是一個非常令人興奮的方向。雖然說這是2026年(要考慮)的事,但它是整個系統中我個人最期待的部分之一。”奧爾特曼直言。▌KV Cache重要性凸顯此前,OpenAI已於2024年2月啟動記憶功能小範圍測試,並於2025年4月升級為可參考全部歷史對話的長期記憶系統,能跨對話保留使用者偏好、工作內容與常用格式,在互動中持續呼叫,顯著強化個性化服務與使用者黏性。可以看到,在奧爾特曼的描述遠景中,擁有了成熟記憶能力的ChatGPT堪稱“開了掛的超級個人AI Agent”。根據《Heterogeneous Memory Opportunity with Agentic AI and Memory Centric Computing》(Jinin So),建構一個強大的“Agentic AI”,因為自注意力機制需要對序列中的每個元素(token)與序列中所有其他元素之間的關係進行建模,因此對記憶體和儲存系統提出了前所未有的、多層次的需求和挑戰。AI記憶系統可以被劃分為工作記憶(處理當前任務)和長期記憶(知識、技能、經驗)。程序性記憶(模型本身):隨著大語言模型參數量的增長,其自身大小已達到TB等級;語義記憶(外部知識庫):儲存外部知識的向量資料庫,其容量需求可達數十TB;工作記憶(執行階段快取):在高並行推理時,僅KV快取(KV Cache)一項就能消耗上百TB的記憶體。整個系統融合了大模型(如Gemini)、外部資料庫(如Milvus)和快取記憶體機制,並通過檢索、學習等方式進行互動,這對資料流動的頻寬和延遲提出了極高要求。其中,“能記住使用者說過的所有話、讀完所有郵件和文件、深度全量參與使用者生活”的AI,需要的正是“工作記憶”。廣發證券指出,AI的“工作記憶”在技術上體現為大模型的“上下文窗口”,它是AI進行複雜、多步推理和決策的工作台與基礎。它的核心功能是整合所有相關資訊以支援連貫思考。通過將系統指令、歷史對話、使用者問題、外部知識(來自語義記憶)和模型的中間思路全部“盡收眼底”,大模型才能進行全面、有深度的推理,而不是孤立地看問題。國金證券稱,目前隨著大模型應用的普及和上下文窗口的不斷擴展,KV Cache技術的重要性將進一步凸顯。無論是ChatGPT的流暢對話體驗,還是Claude的長文件處理能力,都需要KV Cache的技術支撐。未來KV Cache將在智能化、硬體加速、邊緣部署等方向持續演進,為更廣泛的AI應用提供強有力的技術支撐。智能化與硬體化趨勢明確,KV Cache有望在未來數年持續提升大模型推理效率並改善算力成本結構。落實到具體方向上,東方證券認為,儲存供不應求持續,同時海外儲存巨頭在通用儲存方面的擴產進度可能有限,建議關注國內半導體裝置企業中微公司、京儀裝備、微導奈米、拓荊科技、北方華創等;佈局端側AI儲存方案的兆易創新、北京君正等;受益儲存技術迭代的瀾起科技、聯芸科技等;國產企業級SSD及儲存方案廠商江波龍、德明利、佰維儲存等。 (科創板日報)
在Polymarket上押注“OpenAI發佈新模型”,預測市場再陷內幕交易危機
Polymarket押注OpenAI與Google,引發內幕交易嫌疑。過去一周,預測平台Polymarket上少數帳戶押注OpenAI將在12月13日前發佈新的大語言模型。12月11日,OpenAI正式推出GPT-5.2,使得其中四個帳戶累計獲利超1.3萬美元。這使外界更加懷疑,Polymarket和Kalshi等預測平台上的部分帳戶並非單純走運——它們可能接觸到了Google、OpenAI等公司的內部資訊,或者其持有者就是這些公司的員工。預測市場迅猛發展隨著(允許使用者小額投注的)預測平台熱度飆升,越來越多公司開始修訂長期禁止員工利用機密資訊交易股票的政策,將其納入了監管範圍。畢馬威合夥人康威·道奇表示,過去半年裡,他與企業客戶討論是否應將內幕交易政策覆蓋預測市場的次數至少翻了一番。“這可能是金融機構及其他客戶需要開始思考的下一個問題。”加密貨幣和股票交易應用已意識到這一風險。Robinhood已更新了內幕交易政策,將預測市場納入監管範圍。加密貨幣交易所Coinbase發言人聲明稱,Robinhood數月前已進一步擴展政策條款,“禁止員工(包括高管)參與預測市場”。Robinhood營運了自有預測市場,Coinbase計畫下周推出預測服務。OpenAI與Anthropic則表示,其政策會明確禁止員工利用機密資訊謀取私利(包括預測平台)——但政策何時調整或是否調整尚不明確。企業對員工使用預測平台的關注度提升,源於去年Kalshi和Polymarket活動的激增——當時大量使用者湧入押注美國2024年總統大選。這兩個平台允許使用者以不到1美元的價格購買事件合約(即會向正確預測事件結果的投資者支付收益的衍生品)。使用者需預先支付合約費用,若預測正確即可收回本金並獲得利潤。用Kalshi聯合創始人的話說,這種“對任何分歧觀點”的靈活押注模式使預測市場大受歡迎。加密資料提供商Artemis Analytics的資料顯示,Kalshi平台(宣稱受商品期貨交易委員會監管)的交易量在過去半年激增約五倍,最近一周日均交易額達1.83億美元。今年9月,Polymarket宣佈CFTC已批准其再次服務美國使用者(三年前CFTC曾禁止其接受美國使用者交易)。目前Polymarket交易量激增超六倍,日均達1.97億美元。投資者正以越來越高的估值爭相支援這些公司。內幕交易“法外之地”?隨著AI日益成為公眾關注焦點,這些平台開始日益增加與科技產品發佈相關(通常不被傳統博彩網站覆蓋)的投注選項。例如Kalshi的使用者可押注設計師喬尼·艾維正在為OpenAI研發一款“夾戴式裝置”(支付48美分)或“頭戴式顯示器”(支付23美分)。若事件成真,合約價值將升至1美元。然而人們發現,部分使用者似乎擁有"預知能力",會在科技企業發佈公告前反覆對其大額押注——這加劇了人們對獲勝者來自該企業內部的懷疑。上周,Polymarket平台某帳戶通過精準押注Google2025年搜尋資料,單日獲利超百萬美元——這一表現讓人懷疑該帳戶背後是Google內部人士。目前Google發言人拒絕回應公司是否制定了禁止在預測市場進行內幕交易的規定。美國證券法禁止利用“重大非公開資訊”進行交易。但由於預測市場合約不屬於證券範疇,美國證券交易委員會(SEC)對其不具有監管權,需由監管期貨交易的商品期貨交易委員會(CFTC)或司法部負責處理。不過,利用機密資訊在預測市場牟利可能違反員工對僱主的法律義務。米爾班克律師事務所企業治理與證券法專家喬治·卡內洛斯指出:“這相當於一種欺詐行為,類似於貪污,因為你暗中利用資訊謀取私利。”周四,包括Kalshi和Coinbase在內的多家企業宣佈成立新行業組織,倡導接受聯邦監管而非州級監管,首先聚焦制定全國性反內幕交易標準。但複雜之處在於,企業高層有時會暗示員工應有權對自家公司活動進行押注。例如Coinbase CEO布萊恩·阿姆斯特朗近日被問及是否應允許預測市場存在內幕交易。他在《紐約時報》DealBook峰會上回應稱此事“並非黑白分明”。他舉例說,若人們想知道蘇伊士運河何時重開,允許運河上艦船的艦長參與押注會使市場預測更準確;但另一方面“又希望維護這些市場的誠信度”。事實上,包括Google和Anthropic在內的部分企業已建立內部預測市場。員工可通過虛擬貨幣對諸如團隊何時完成項目等議題進行投注。Google現行預測市場的建立者、預測網站Metaculus的CTO丹·施瓦茨指出,此類市場預測僅在公司內部,不會損害企業利益。他認為,這類內部預測與其說是在遏制內幕交易,不如說是在“鼓勵內幕交易”,“其核心在於促使員工主動披露所掌握的資訊”。 (創新觀察局)