#設計
黃仁勳酒後暴論:程式設計只是打字,已經不值錢了
美國時間2月3日晚間,一場本該正襟危坐的頂級科技對話,最終變成了一場“五杯酒後的坦白局”。剛結束中國之行、甚至還沒來得及倒時差的輝達CEO黃仁勳,坐在了思科CEO查克·羅賓斯(Chuck Robbins)對面。幾杯酒下肚,黃仁勳的嗓音開始沙啞,但話語卻越來越犀利。藉著酒勁,黃仁勳不僅“砸”了程式設計師的飯碗,“懟”了管理學的教條,甚至還對幾家世界級巨頭來了一波貼臉“拉踩”:關於程式設計師:“程式設計?那只是打字而已。打字已經不值錢了。”關於控制慾:“如果你想掌控創新,那你該去看看心理醫生。”關於摩爾定律:“10年算力提升了100萬倍,在這種速度面前,昔日的摩爾定律簡直慢得像蝸牛在爬。”關於傳統巨頭:“我很愛迪士尼,但我敢肯定他們更想成為Netflix;我很愛梅賽德斯,但我確信他們更想成為特斯拉。”關於AI進化:“為什麼要讓人去適應工具?讓AI學會使用工具,我們才能創造出真正的‘數字勞動力’。”黃仁勳用這些“爆論”提醒所有掌舵者:在指數級進化的浪潮面前,你過去引以為傲的經驗,註定將被時代無情淘汰。01“失控”的百花齊放:你的第一課不是ROI,是“放手”當羅賓斯問及企業邁向AI的第一步應該是什麼時,黃仁勳的回答繞開了所有常規的商業話術。“我經常被問到投資回報率這類問題,但我不會先談那個。”他直截了當地說。在他看來,在技術爆發的黎明期,用電子表格去框定價值是徒勞的,甚至是危險的,因為這只會扼殺探索的觸角。他拿出了輝達內部的實踐作為例子:讓“百花齊放”。在輝達內部,AI項目多到幾乎失控。“注意我剛才說的:失控,但棒極了。”黃仁勳強調。他對此的解釋充滿哲學意味:“創新並不總是在掌控之中。如果你想掌控一切,首先應該去諮詢心理醫生;其次,那是一種錯覺,你根本掌控不了。”他的管理邏輯簡單到令人驚訝,像對待孩子一樣對待團隊的好奇心。“當我們的某個團隊說想嘗試某種AI時,我的第一個回答是‘可以’,然後我會問‘為什麼’。我不是先問為什麼再同意,而是先同意再問為什麼。”他對比道,我們在家裡從不這樣要求先給出證明,但在工作中卻這樣做,這對他來說毫無邏輯。黃仁勳描繪的路徑圖清晰而反直覺:第一步不是制定嚴謹的試點計畫,而是允許甚至鼓勵“安全地試錯”。讓每個有想法的團隊去接觸、去嘗試各種AI工具,無論是Anthropic、Codex還是Gemini。其目的不是立即產出效益,而是培養組織的“AI感覺”。只有經過一段充分甚至略顯混亂的百花齊放期,領導者才能憑藉直覺和觀察,知道何時該開始“修剪花園”,將資源集中到真正重要的方向上。“但你不能太早集中力量,否則會選錯箭。”他警告道。02從“螺絲刀”到“創造勞動力”:AI工廠的本質是價值轉移那麼,當企業開始探索之後,究竟要看向何方?黃仁勳用“AI工廠”這個概念,描繪了一幅遠比提升效率更宏大的圖景。他認為,我們正在經歷從“製造工具”到“創造勞動力”的根本性轉變。“我和查克所在的行業一直在製造工具,始終在做螺絲刀和錘子的生意。”過去幾十年,科技公司生產軟體、晶片、網路裝置,這些都是工具,是原子世界效率的延伸。但AI,特別是能夠理解物理世界、具備因果推理能力的物理AI,將改變遊戲規則。“有史以來第一次,我們要創造人們所謂的‘勞動力’,或者是‘增強型勞動力’。”他舉例說,自動駕駛汽車本質上是一個數字司機,而這個數字司機的生命周期經濟價值,將遠超汽車本身這個硬體。這才是“AI工廠”的深層含義:它不是一個存放伺服器的機房,而是一個源源不斷產出“數字勞動力”的新型價值創造中心。這種勞動力可以是一個永不疲倦的客服,一個即時最佳化供應鏈的調度員,或是一個能協同設計的工程師助手。黃仁勳給出了一個震撼的數字對比:全球IT產業規模大約在1兆美元,而全球經濟總量是100兆美元。“我們第一次面對一個拓寬了百倍的潛在市場總量。”這意味著,AI帶來的最大機會不是瓜分現有的IT預算,而是去滲透和重塑那剩下的99兆實體經濟。每一個行業都有機會通過注入這種數字勞動力,將自己重塑為一家技術公司。“我相信迪士尼寧願成為Netflix,梅賽德斯寧願成為特斯拉,沃爾瑪寧願成為亞馬遜。”他尖銳地指出,你們所有人都是這樣的。03“無限快”與“零重力”:用AI思維重新定義難題如何才能真正抓住這百兆級的機遇?黃仁勳提出了一個顛覆性的思維模型:用“豐盈”(Abundance)的假設來思考一切。他諷刺地說,在AI時代,昔日的摩爾定律慢得簡直像蝸牛爬。現在,我們需要建立新的認知基準。“過去10年,我們的算力提升了多少?10年100萬倍。”在這種指數級豐盈的前提下,企業領導者的思維必須升級。“現在當我想像一個工程問題時,我假設我的技術、我的工具、我的飛船是無限快的。去紐約要多久?一秒鐘就到。”他啟髮式地問道,如果一秒鐘能到紐約,你會做些什麼不同的事?如果過去需要一年的事情現在能即時完成,你會做些什麼不同的事?如果過去很重的東西現在變得沒有引力了,你會如何處理?他要求管理者將這種無限快、零重力的假設應用到公司最核心、最棘手的難題上。比如面對一個擁有數兆關聯關係的複雜網路分析,過去的做法是分而治之。“現在則是:把整個圖都給我,多大都行,我不在乎。”這種邏輯正在被應用到各處。如果你不應用這種邏輯,你就做錯了。這不再是漸進式的最佳化,而是用技術富足的可能性去重新定義問題本身的邊界。他警告,如果你的競爭對手或某個初創公司以這種思維方式發起挑戰,他們將從根本上改變遊戲規則。04你的“問題”比答案更值錢:主權AI與未來公司核心在暢想了無處不在的數字勞動力之後,黃仁勳將話題拉回一個更現實也更隱秘的關切:資料主權與核心智慧財產權。針對企業應該完全依賴公有雲還是自建AI能力的問題,他的建議如同教孩子學騎車。“自己造一台。儘管PC隨處可見,但去動手造一台,去弄明白為什麼這些元件會存在。”他認為,企業必須擁有“切身的技術掌控力”。更重要的是,他提出了一個尖銳的觀點:公司最寶貴的智慧財產權,可能不是儲存在資料庫裡的答案,而是員工與AI互動過程中產生的“問題”。“我不放心把輝達的所有對話都放在雲端,因為對我來說,核心智慧財產權不是答案,而是我的提問。”黃仁勳解釋道:“我的提問才是我最有價值的IP。我在思考什麼,我的提問反映了這一點。答案是廉價的。如果我知道該問什麼,我就鎖定了重點。我不希望別人知道我認為什麼是重要的。”因此,他認為涉及戰略思考的對話,必須在受控的本地環境中進行。他描述道,未來每個員工都會有許多AI助手,這些AI持續學習員工的決策和疑問,最終這些進化了的AI將成為公司沉澱下來的獨特智能資產。“這就是未來的公司,它會捕捉我們的生命經驗。”05五層蛋糕與“預錄製”時代的終結:從檢索到生成的根本革命當談到具體實施路徑時,黃仁勳回溯了一場持續了15年的認知革命。他追溯至AlexNet代表的第一次接觸時刻,並得出一個結論:世界大多數難題並無精確物理定律可循,答案往往是視具體情境而定。這類依賴上下文的問題,正是AI能夠大顯身手的領域。真正的拐點是自監督學習的突破,這使得參數從數億爆炸性增長至數兆。他斷言:“我們將從底層重塑計算。計算將從顯式程式設計轉向一種全新的範式,即通過模型學習軟體。”緊接著,黃仁勳用了一個精妙的比喻:我們正從“預錄製”時代,邁入了“生成式”時代。“過去的軟體之所以是‘預錄製’的,是因為它裝在CD-ROM裡。”在舊範式裡,軟體如同燒錄好的光碟,使用者互動本質上是檢索。而未來的軟體將是高度場景化的。“每個場景都不同,每個使用者、每個提示詞、每個背景都不同。每一份軟體實例都是獨特的。”未來的應用將根據即時上下文、意圖和背景,動態生成獨一無二的響應、介面甚至功能。這就是生成式的核心,傳統的硬體、框架、模型各層的建構邏輯都已改變。06隱式程式設計革命:當“打字”成為通用技能,你的專長才是王牌在這場深刻變革中,行業知識的價值正在飆升。“從顯式程式設計到隱式程式設計,你只需要告訴電腦你想要什麼,電腦就會寫程式碼。”他指出,這場持續了60年的以編寫精確程式碼為核心的計算範式正在終結。“因為事實證明,寫程式碼只是打字而已,而打字已變得平庸化。”這意味著技術能力的門檻將被極大降低。相反,那些深諳業務但不懂技術的領域專家,將站上浪潮之巔。“剛畢業的電腦高材生程式碼很厲害,但他們不知道客戶想要什麼。你們知道。寫程式碼的部分很簡單,讓AI去做就行。理解客戶、理解問題的領域專長,這才是你擁有的超級力量。”這場對話以對思科的感謝作結,但留下的核心資訊無比清晰:AI革命不是IT部門的升級,而是一次商業邏輯的“重設”。隨著夜色漸深,對話在關於烤串和薯片的調侃中結束。但黃仁勳帶著醉意吐露的真言,如同他預言的那些數字勞動力一樣,已經開始無聲滲透,準備重塑我們所熟知的一切。【以下是實錄全文】羅賓斯:嘿,嘿,嘿。對,大家待在那兒別動。黃仁勳:我覺得我現在的狀態就像是在邊喝酒邊辦公。羅賓斯:剛才我們把酒拿上來時,黃仁勳提醒了我。他說:“你意識到你正在直播這個,對吧?”嘿,管他呢,天色已經晚了。黃仁勳:第一個原則是:不造成傷害,並且要意識到你是多麼幸運。羅賓斯:首先,感謝大家在這裡度過了漫長的一天。我們今天一早就開始了,演講者一個接一個,在大概兩個半小時的休息後,大家又回來見你了。黃仁勳:我今天凌晨一點就起床了。羅賓斯:所以,這傢伙正處於一段為期兩周、跨越亞洲四五個城市的旅程末尾。黃仁勳:一天前我還在台灣地區,昨晚在休斯頓,現在我在這裡。羅賓斯:他出門兩周了,現在咱們正攔在他回自家熱被窩的路上呢,他已經住夠了酒店。所以,我們會玩得開心點,然後放他走。雖然你不需要太多介紹,但還是謝謝你能來,夥計。我們真的很感激。黃仁勳:感謝我們的合作夥伴關係,也為你們感到驕傲。羅賓斯:那我們就從合作開始談起吧。我們一直有合作,你引入了“AI工廠”的整套概念。我們正在合作推進,雖然在企業領域可能沒我們想得那麼快。我們能先聊聊對你來說什麼是“AI工廠”嗎?黃仁勳:首先要記住,我們正處於60年來首次重塑計算的過程中。過去是“顯式程式設計”(explicit programming),對吧?我們編寫程序和變數,通過API傳遞,這些都非常明確;現在轉向了“隱式程式設計”(implicit programming)。你現在告訴電腦你的意圖,它會去想辦法解決你的問題。從顯式到隱式,從通用計算(本質上是計算)到人工智慧,整個計算堆疊都被重塑了。現在人們討論計算時總關注處理層(processing layer),也就是我們所處的層面。但請記住計算的構成。除了計算和處理,還有儲存、網路和安全。這一切都在此時此刻被重塑。第一部分是我們需要把AI提升到一個水平——我們稍後會詳談——需要提升到對人有用的水平。直到目前,那種你給一個提示詞,它想辦法告訴你答案的聊天機器人(chat bots),雖然有趣且令人好奇,但還不算真正有用。羅賓斯:有時它能幫我完成填字遊戲。黃仁勳:是的,但也僅限於它記住和泛化的東西。如果你回頭看,其實也就是三年前ChatGPT剛出現的時候,我們驚嘆它能生成這麼多詞句,能創作莎士比亞作品。但那都是基於它記憶和泛化的內容。我們知道,智能的核心在於解決問題。解決問題部分在於知道你不知道什麼,部分在於推理如何解決從未見過的問題。將問題分解為已知且易於解決的元素,通過組合來解決從未見過的問題,並制定策略(我們稱之為“規劃”)來執行任務、尋求幫助、使用工具、進行研究等等。這些都是現在“智能體AI”(agentic AI)術語中的基本內容,包括工具使用、研究、基於事實的檢索增強生成(RAG)、記憶等。你們在討論智能體AI時都會聽到這些。但最重要的一點是,為了從這種“顯式程式設計”的通用計算(我們用Fortran、C、C++編寫的時代)進化。羅賓斯:對。黃仁勳:那是好東西,羅賓斯。羅賓斯:那是我的保底工作。黃仁勳:那是非常好的技能,那些技能依然有價值。羅賓斯:我知道。黃仁勳:它們依然有價值。羅賓斯:我已經拿到很多錄取通知了。黃仁勳:“恐龍”永遠是有價值的。我們剛證實了你比我大。我知道我是那個“史前時代”的人,雖然看起來不像,但確實如此。好了,這挺有意思的。我可能是這屋裡最老的人了。羅賓斯:那我們聊聊這個。黃仁勳,當你思考未來時。黃仁勳:我們現在就在這兒。我去找羅賓斯說:“嘿,聽著,我們需要重塑計算,思科必須參與其中。”我們有一整套全新的計算堆疊即將推出,叫Vera Rubin。思科將與我們同步推向市場。此外還有網路層,思科將整合我們的AI網路技術,並將其放入思科的Nexus控制平面中。這樣從你的角度來看,你既能獲得AI的所有性能,又保留了思科的可控性、安全性和管理性。我們在安全領域也會做同樣的事情。每一個支柱都必須重塑,企業計算才能受益。我們晚點再聊這個:為什麼三年前企業AI還沒準備好,以及為什麼現在你別無選擇,必須盡快參與進來。不要落後。你不必成為第一家利用AI的公司,但千萬別做最後一家。羅賓斯:沒錯。那麼如果你是今天的企業主,你建議他們採取的第一、第二、第三步是什麼,來開始做好準備?黃仁勳:我經常被問到投資回報率(ROI)這類問題,我不會先談那個。原因是,在所有技術部署的初期,很難用Excel表格算出新工具、新技術的ROI。我會去做的事,找出我公司的本質是什麼?我們公司做的最有影響力的工作是什麼?別在那些邊緣、次要的事情上浪費時間。在我們公司,我們就是讓“百花齊放”(let a thousand flowers bloom)。我們公司內部不同的AI項目多得幾乎失控,這非常棒。注意我剛才說的:失控且棒極了。創新並不總是在掌控之中。如果你想掌控一切,首先該去諮詢心理醫生。其次,那是一種錯覺,你掌控不了。如果你想讓公司成功,你控制不了它,你只能影響它。我聽到太多公司想要明確、具體、可論證的ROI,但在初期展示某件事的價值是很困難的。我建議讓百花齊放,讓人們去實驗,讓人們安全地實驗。我們公司在實驗各種東西,我們用Anthropic,用Codex,用Gemini,什麼都用。當我們的某個團隊說想嘗試某種AI時,我的第一個回答是“可以”,然後我會問“為什麼”。我不是先問為什麼再同意,而是先同意再問為什麼。原因是我對公司的期望和對孩子是一樣的:去探索生活。他們說想嘗試某件事,答案是“好”,然後才問原因。你不會說:“先證明給我看,證明做這件事能帶來財務成功或未來的幸福,否則我不讓你做。”我們在家裡從不這樣做,但我們在工作中卻這樣做。羅賓斯:你明白我的意思嗎?黃仁勳:是的。這對我來說毫無邏輯。所以我們對待AI的方式,無論是之前的網際網路還是雲技術,就是讓百花齊放。然後在某個時間點,你需要用自己的判斷力來決定何時開始“整理花園”。因為百花齊放會讓花園變得很亂。但在某個點,你必須開始整理,找到最好的方法或平台,以便集中力量辦大事(put all your wood behind one arrow)。但你不能太早集中力量。羅賓斯:否則會選錯。黃仁勳:沒錯。所以先讓百花齊放,到某個點再整理。就目前的進展來看,我還沒開始整理呢,我還在讓各地百花齊放。但我當然知道什麼對我們公司最重要。我確保有大量的專業知識和能力集中在利用AI革命化那些核心工作上,在我們的案例中,就是晶片設計、軟體工程、系統工程。你可能注意到了,我們與新思科技、楷登電子、西門子以及今天的達索系統合作,這樣我們就能注入我們的技術。無論他們想要什麼,我都會提供,以便革命化我們設計產品的工具。我們到處都在用新思科技、楷登電子、西門子和達索。我會確保他們得到1000%的支援,這樣我就有了創造下一代產品所需的工具。這反映了我對重塑自身工作的態度。想想AI做了什麼:它成數量級地降低了智能的成本,或者說創造了海量的智能。換句話說,過去需要一個單位時間的工作,現在過去需要一年的,可能只要一天;過去需要一年的,現在可能只要一小時,甚至可以即時完成。在“豐盈”(abundance)的世界裡,摩爾定律慢得簡直像蝸牛爬。記住,摩爾定律是每18個月翻兩倍,5年10倍,10年100倍。但我們現在在那?10年100萬倍。在過去10年裡,我們將AI推進得如此之遠,以至於工程師說:“嘿,猜怎麼著?我們干脆用全世界所有的資料來訓練一個AI模型吧。”他們指的不是收集我硬碟裡的資料,而是拉取全世界的資料。這就是“豐盈”的定義。它的定義是:當你看到一個巨大的問題時,你說:“管他呢,我全部都要解決。”我要治癒每一個領域的疾病,而不僅僅是癌症。我們直接解決人類所有的痛苦。這就是“豐盈”。現在當我想像一個工程問題時,我假設我的技術、我的工具、我的飛船是無限快的。去紐約要多久?一秒鐘就到。如果一秒鐘能到紐約,你會做些什麼不同的事?如果過去需要一年的事情現在能即時完成,你會做些什麼不同的事?如果過去很重的東西現在變得沒有引力了,你會如何處理?當你帶著這種態度去處理每一件事時,你就是在應用“AI邏輯”。這有意義嗎?比如我們合作的很多公司,圖分析中的依賴關係、節點和邊多達數兆。過去你會一小塊一小塊地處理圖,現在則是:“把整個圖都給我,多大都行,我不在乎。”這種邏輯正在被應用到各處。如果你不應用這種邏輯,你就做錯了。速度重不重要?一點也不重要,因為你處於光速。質量重不重要?零重量,零重力。如果你沒有應用這種邏輯去思考你公司裡最難的問題,你就沒做對。這就是他們所有人的思維方式。如果你不這麼想,你只要想像你的競爭對手在這麼想就行了。想像一家即將成立的公司在這麼想,這會改變一切。所以,去找到你公司裡最有影響力的工作,給它應用“無限”、“零”、“光速”的概念,然後問羅賓斯怎麼實現。羅賓斯:給我就行。黃仁勳:我們會一起實現。羅賓斯:你有一個“五層蛋糕”的類比,因為大家都在談論基礎設施、模型、應用。我該怎麼做?談談這個。黃仁勳:成功人士做的一件事就是推理正在發生什麼。大約15年前,一個演算法讓兩名工程師解決了一個電腦視覺問題。視覺是智能的第一部分:感知。智能由感知、推理、規劃組成。感知是:“我是什麼?發生了什麼?我的上下文是什麼?”推理是:“我如何根據目標進行推理?”第三是制定計畫去實現目標。就像戰鬥機的問題,感知定位然後行動。沒有感知就沒有第二和第三部分。如果不理解上下文(context),你就不知道該做什麼。而上下文是高度多模態的,有時是PDF,有時是電子表格。有時是感官和氣味,比如我們在那,在幹什麼,聽眾是誰,如何閱讀房間裡的氣氛,等等。大約13、14年前,我們在電腦視覺領域取得了巨大的跨越。AlexNet是我們看到的第一個突破,那就像是《第一次接觸》(First Contact),我愛死那部電影了。那是我們與AI的“第一次接觸”。於是我們思考:這意味著什麼?兩名工程師怎麼可能戰勝了我們所有人鑽研了30年的演算法?我昨天剛和Ilya Sutskever聊過,還有Alex Krizhevsky。兩個帶著幾塊GPU的年輕人怎麼可能解決了這個問題?這意味著什麼?十年前我對此進行了分解和推理,得出的結論是:世界上大多數有價值的難題其實都沒有基本的物理演算法。沒有F=ma,沒有麥克斯韋方程組,沒有薛定諤方程或歐姆定律,沒有熱力學定律,它沒那麼精確。那些我們稱之為“直覺”和“智慧”的有價值的事物,就像你和我會遇到的問題,答案通常是:“視情況而定”(It depends)。如果答案總是3.14那就太棒了,但生活中有價值的難題往往取決於背景和環境。既然視覺問題解決了,我們推理出通過深度學習,這不僅是可擴展的,你還可以把模型做得越來越大。我們當時要解決的唯一問題是如何訓練模型,而巨大的突破是“自監督學習”。AI開始自我學習。注意,今天我們已經不再受限於人工標註資料了,完全不受限。這打開了閘門,讓模型從幾億參數擴展到幾千億、幾兆。我們可以編碼的知識和學習的技能爆炸式增長。我們將從底座重塑計算。計算將從“顯式程式設計”轉向一種全新的範式,即通過模型學習軟體。這對計算堆疊意味著什麼?對軟體開發意味著什麼?對工程組織、產品行銷、QA團隊又意味著什麼?這些產品未來會變成什麼樣?我們如何部署?如何保持更新?如何修補軟體?我當時問了上千個關於未來計算的問題,得出的結論是:這將改變一切。於是我們將整個公司轉向上。簡單來說,我們從一個所有東西都是“預錄製”的世界走來。羅賓斯:確實是很棒的東西。黃仁勳:運行了很長時間。鄭重聲明,那些確實是用希伯來語描述的(幽默暗示舊技術的古老)。羅賓斯:確實。那是另一項技能。黃仁勳:畢竟,這屋裡恐怕只有你,能同時精通希伯來語和COBOL了。無論如何,那是預錄製的。我們編寫演算法,描述思想,然後配上資料。一切都是預錄的。過去的軟體之所以是預錄的,是因為它是裝在CD-ROM裡的,對吧?現在的軟體是什麼?它是情境化的,每個情境都不同,每個使用者、每個提示詞、每個前置背景都不同。每一份軟體實例都是獨特的。過去預錄製的軟體被稱為“基於檢索模式”(retrieval-based)。當你用手機點一下,它會去檢索一些軟體、檔案或圖像並展示給你。而未來,一切都將是“生成式”的(generative),就像現在這樣。這場對話以前從未發生過。概念存在過,背景存在過,但這每一句話的順序都是全新的。發生這種情況的原因顯而易見,因為我們已經喝了四杯酒了。羅賓斯:還有冷萃咖啡。Cobol、希伯來語,謝天謝地這不在校園裡,也沒在直播。黃仁勳:嗯。羅賓斯:大家都明白你在說什麼嗎?黃仁勳:你們聽懂了嗎?羅賓斯今天只給我喂了四杯酒。羅賓斯:公平點說,我只喂了你一杯,剩下三杯是你從自助餐檯上拿的。黃仁勳:我一直在盯著那些食物,我太餓了。食物離我大概有40英呎(12米)遠。羅賓斯:那是因為你一直在拍照。黃仁勳:真的很近,但我好幾次想過去都被推回來了。羅賓斯:你知道發生了什麼嗎?你的團隊提前告訴過我們,如果他喝了三杯,他就是最佳狀態。如果喝到第四杯,情況就要崩了。黃仁勳:這狀態可就不太理想了。好了,聽著,我們得留下一些智慧。能再來一杯酒嗎?羅賓斯:這可不是Dave Chappelle的脫口秀。黃仁勳:談談別的。能源。羅賓斯:晶片。黃仁勳:能源聽起來不錯。能源、晶片、基礎設施(硬體和軟體),然後是AI模型。但AI最重要的部分是應用。每一個國家、每一家公司,底下的那些層都只是基礎設施。你需要做的是應用這項技術。向上帝發誓,快去應用這項技術。使用AI的公司不會陷入險境。你不會因為AI丟掉工作,你會因為一個使用AI的人而丟掉工作。所以,行動起來,這是最重要的。羅賓斯:並且盡快給羅賓斯打電話。黃仁勳:你打給我,我打給他。羅賓斯:我們時間不多了。黃仁勳:我們有的是時間。羅賓斯是按時計費的,而我甚至不戴手錶。我在價值交付之前是不會離開的。如果需要一整晚,我會一直折磨你們所有人。羅賓斯:黃仁勳,這就是為什麼像我這樣的人需要表。你能談談“物理AI”嗎?黃仁勳:軟體行業在衰落並會被AI取代的這種說法是世界上最沒邏輯的事。讓我們做一個終極思想實驗:假設我們是終極的AI——通用機器人,物理版的。既然你是類人機器人,你能解決任何問題。你會用現成的螺絲刀還是發明一把新螺絲刀?我直接用現成的。你會用現成的鏈鋸還是重造一把?答案顯而易見是使用工具。既然如此,再看數字版。如果你是AGI(通用人工智慧),你會去使用ServiceNow、SAP、Cadence、Synopsis,還是去重新發明一個計算器?當然是直接用計算器。為什麼要讓AI學會使用工具?因為現有的工具是‘確定性’的。世界上很多問題都有標準答案,比如牛頓第二定律F=ma。你不需要AI給你一個機率上約等於ma的模糊答案,ma就是ma。再比如歐姆定律V=IR,它在科學上是絕對的,而不是‘統計學上的IR’。所以,我們希望AI像人類一樣,直接拿起這些精準的工具去用,而不是在那些已經有標準答案的事情上瞎猜。我們希望AGI使用工具,這是個大邏輯。下一代物理AI將理解物理世界和因果關係。如果我推倒這個,它會帶倒那一切。它們理解“多米諾骨牌”的概念。每一個孩子都能理解推倒它意味著什麼,這種因果、接觸、引力和質量的結合是非常深刻的。大語言模型目前還沒這概念,所以我們要創造物理AI。機會在那裡?到目前為止,我和羅賓斯所處的行業一直在製造工具。我們一直處於“螺絲刀和錘子”的生意中。有史以來第一次,我們要創造人們所謂的“勞動力”,或者是“增強勞動力”。比如自動駕駛汽車是什麼?它是一個數字司機。數字司機的價值遠超汽車本身。我們第一次面對一個潛在市場總量(TAM)大了一百倍的市場。全球IT產業大約一兆美元,而全球經濟規模是一百兆。你們所有人都有機會通過應用這項技術,成為一家技術公司。我相信迪士尼寧願成為Netflix,梅賽德斯寧願成為特斯拉,沃爾瑪寧願成為亞馬遜。你們同意嗎?這三個例子我說對了嗎?羅賓斯:是的。你們所有人都是這樣的。黃仁勳:我們有機會幫助每一家公司轉型為“技術優先”的公司。技術是你的超級力量,而你的行業領域是應用場景。為什麼要技術優先?因為那樣你就是在和“電子”打交道,而不是“原子”。原子的價值受限於質量,而電子的價值在CD-ROM變成電子流的那一刻爆炸了千倍。你需要成為一家技術公司。即便是只懂希伯來語程式設計的羅賓斯,這也是一種天賦。羅賓斯:這個程式設計方向從右往左寫,挺聰明的。黃仁勳:聰明人做聰明事。最美妙的是,你們公司的優勢是知識、直覺和領域專業能力。現在你第一次可以用自己的語言向電腦解釋你想要什麼。從顯式程式設計到隱式程式設計,你只需要告訴電腦你想要什麼,電腦就會寫程式碼。因為事實證明,寫程式碼只是打字而已,而打字已變得平庸化。這是你們巨大的機會。你們全都能從物理(原子)層面的束縛中解脫出來,實現質的飛躍。我們不用再受限於沒有足夠的軟體工程師,因為打字是廉價的,而你們擁有極其珍貴的東西——理解客戶、理解問題的領域專長。剛畢業的電腦高材生可能寫程式碼很厲害,但他們不知道客戶想要什麼,不知道該解決什麼問題。你們知道。寫程式碼的部分很簡單,讓AI去做就行。這就是你的超級力量。我這個總結是在喝了五杯酒後做出的。羅賓斯:這簡直是個奇蹟。黃仁勳:能和各位合作是莫大的榮幸。思科在計算發明的兩個支柱領域——網路和安全——有著極深的造詣。沒有思科就沒有現代計算。在AI世界,這兩個支柱都被重塑了。我們擅長的計算部分在很多方面是廉價商品,而思科掌握的東西極具價值。早前有人問我:應該租用雲端還是自己建構電腦?我的建議和給我孩子的建議一樣:自己造一台。儘管PC隨處可見,但去動手造一台,去弄明白為什麼這些元件會存在。如果你在運輸行業,別只用Uber,去打開引擎蓋,去換個機油,去理解它。這項技術對未來太重要了,你必須有一種觸覺上的理解。你可能會發現自己對此極有天賦。你可能會發現世界並非全是“租”或全是“買”,你需要一部分在本地(on-prem)。比如涉及主權和私有資訊時,你不會想把所有的“問題”都分享給所有人。舉個例子,你去見心理醫生時,你不希望你的提問被發到網上。羅賓斯:假設性的例子,對吧?黃仁勳:對,假設性的。所以我認為很多對話和不確定性應該保持私密。公司也是一樣。我不放心把輝達的所有對話都放在雲端,所以我們在本地建構了超級AI系統。因為對我來說,最有價值的核心資產不是答案,而是我的提問。你們聽明白了嗎?我的提問才是我最有價值的IP。我在思考什麼,我的提問反映了這一點。答案是廉價的。如果我知道該問什麼,我就鎖定了重點。我不希望別人知道我認為什麼是重要的。所以我要在自己的小房間裡,在本地,創造我自己的AI。最後一點想法,現在已經11點了。過去有個觀點叫“人在環節中”(human in the loop),這是完全錯誤的。應該是“AI在環節中”(AI in the loop)。我們的目標是讓公司每一天都變得更好、更有價值、知識更豐富。我們不希望倒退或原地踏步。這意味著如果AI在環節中,它會捕捉我們的生命經驗。未來每個員工都會有許多AI在環節中,這些AI會成為公司的智慧財產權。這就是未來的公司。所以,我覺得明智的做法是立即給羅賓斯打電話。羅賓斯:我打給黃仁勳。兩周的旅程,黃仁勳飛到這裡和我們度過了最後一晚,這是他很久以來第一次能睡在自己的床上。我們永遠感激。黃仁勳:非常感謝。另外,我眼角餘光一直瞄著那些肉串。羅賓斯:我希望它們還在那兒。黃仁勳:答應我的那袋薯片在那?羅賓斯:走吧,去吃。謝謝大家! (首席商業評論)
成癮性設計:歐盟或處TikTok全球年營業額最高6%約數十億美元的罰款,TikTok回應:調查結果完全錯誤
歐盟委員會2月6日宣佈,經過兩年的調查,初步結論顯示,TikTok因存在“上癮式”設計違反了歐盟《數字服務法》。TikTok方面稱,調查結果“完全錯誤”。據環球網報導,歐盟委員會官網於2024年2月發佈消息稱,其已正式啟動對字節跳動旗下短影片社媒平台TikTok的調查,以審查該線上平台是否採取了足夠措施防止非法內容的傳播,以及是否違反保護未成年人、研究人員資料訪問等歐盟《數字服務法》(DSA)的規定。據英國廣播公司(BBC)報導,歐盟委員會在初步調查結果中指出,TikTok未能“充分評估”其自動播放等功能可能對使用者(包括兒童)造成的身心健康影響,也未採取有效措施降低風險。歐盟稱,TikTok的時間管理工具“容易被忽略”,尤其是對年輕使用者,而家長控制功能則需要“花費額外時間和技能”才能啟用。歐盟委員會提出了TikTok可採取的幾項建議措施,包括在夜間設定“螢幕使用休息”機制;調整推薦演算法,為使用者提供個性化內容;停用所謂的“無限滾動”,防止使用者快速瀏覽平台上的數百萬視訊。歐盟委員會可對TikTok處以全球年營業額最高6%的罰款,預計數額將達數十億美元。如果TikTok想避免罰款,就必須“改變其在歐洲的服務設計”。TikTok發言人表示,歐盟委員會的調查結果對平台的描述“完全錯誤且毫無依據”,並表示計畫提出異議。歐盟去年還針對社交平台X展開調查,關注其AI工具Grok是否用於生成真實人物的性化圖像。去年12月,歐盟對X平台因“藍勾認證”問題處以1.2億歐元罰款,稱該平台未“有效驗證帳戶背後的人”,存在“誤導使用者”問題。據法媒報導,社交媒體分析師保羅·佩斯卡托雷表示,歐盟最新舉措對TikTok是一次“現實檢驗”,也是對所有社交媒體平台的“警告訊號”。市場正在從“最大化參與度”轉向“設計責任”,而監管機構現在擁有執行轉向的工具。去年12月,澳大利亞針對16歲以下人群的社交媒體禁令正式生效,這是世界上第一例通過立法實施此類社交媒體最低年齡限制的舉措。多國已在考慮限制青少年訪問社交媒體。 (傳媒圈)
GitHub 上,人類已經幹不過 AI 了
今年,GitHub 上,AI 提交量佔比將達到 20%如果幾年前有人跟碼農同學說,「你以後可能要和 AI 搶 GitHub 提交記錄了」,他大概會笑掉大牙。但現在,他可能完全笑不出來了。根據 SemiAnalysis 最新發佈的分析報告,Anthropic 的 Claude Code,目前已經貢獻了 GitHub 上 4% 的公開提交量,並且有望在 2026 年底:達到 20% 的日提交量。這不是一個簡單的數位遊戲。當一個 AI 工具開始在全球最大的程式碼託管平台上「刷存在感」,它實際上正在重新定義什麼叫「寫程式碼」。01. AI「霸榜」GitHub4% 看起來並不是個很大的數字,但可怕的是這個數字背後的意義。GitHub 每天的提交量是一個天文數字。全球數千萬程式設計師在這個平台上推送程式碼、修復 bug、發佈新功能。而現在,每 25 次提交中,就有 1 次來自 AI。Anthropic Claude Code 負責人 Boris Cherny 在 X 上毫不避諱地「炫耀」:他的團隊現在 100% 使用 Claude Code 寫程式碼,連小的編輯都不再手動操作。更誇張的是,他們用一周半時間就用 Claude Code 建構了 Cowork 應用。這種效率提升不是線性的,而是指數級的。但真正讓人震撼的不是速度,而是質量。一位企業使用者透露,他 80% 的時間在使用 Claude Code,剩下 20% 用其他工具。「我的公司為 Claude Code 付費,我甚至不看成本。」這句話很有意思——當一個工具好用到讓人「不看成本」,說明它創造的價值,已經遠超價格。曾有業內人士曾這樣評價 AI Coding 的優勢:「AI 能繞過官僚主義。如果猶豫不決會讓大型組織陷入癱瘓,AI 不在乎。它會愉快地生成一個版本 1。」這句話點出了 AI 程式設計的核心優勢——沒有包袱,沒有猶豫,沒有「完美主義焦慮」。02. 程式設計師的「存在危機」但硬幣總有兩面。在 Hacker News 上,一位使用者分享了他的挫敗感:「多次我希望程式碼看起來是某種樣子,但它不斷拉回到它想要做事情的方式... 最終,我發現不與它爭鬥、讓它按照它想要的方式做事情更容易。」這段話透露出一個微妙的權力轉移:從「人指導 AI」到「人適應 AI」。Every 公司 CEO Dan Shipper 在部落格中寫道:「我們正處於自主程式設計的新時代。你可以在不看一行程式碼的情況下建構令人驚嘆的複雜應用程式。」聽起來很美好,但這也意味著傳統意義上的「程式設計師」,正在消失。如果你不需要看程式碼就能建構應用,那「會寫程式碼」,還算是一種核心技能嗎?SemiAnalysis 的分析師預測,這個趨勢將推動 Anthropic 在 2026 年實現爆發性增長,甚至超越 OpenAI。相比之下,GitHub Copilot 和 Office Copilot 雖然領先了一年,但「幾乎沒有作為產品取得任何進展」。這個對比很殘酷,也很說明問題:在 AI 時代,先發優勢可能不如產品體驗重要。03. 重新定義「程式設計師」但程式設計師同學可能不需要過分焦慮,程式設計師這個崗位不會消失,只是這個職業的定義在改變。就像 Dan Shipper 說的,即使在 2025 年,「你仍然需要真正理解底層架構,也許你仍然需要去查看程式碼」。但這個「需要」的含義已經不同了。程式設計師正在從「程式碼編寫者」變成「AI 協調者」。你需要知道如何與 AI 對話,如何審查它的輸出,如何在它犯錯時糾正它。你需要理解系統架構,但不一定需要親自實現每一行程式碼。一位 Google 工程師的反思很有代表性:社區對 AI 程式設計能力的討論「緊張」,一方面驚嘆於能力的提升,另一方面擔心被替代。但他強調,領域專業知識仍然重要,原型和生產環境之間的差距仍然存在。當 AI 程式設計足夠便宜、足夠好用,整個軟體開發的經濟學都會改變。也許 20% 的 GitHub 提交量只是開始。也許幾年後,我們會看到 50%、80%,甚至更高的比例來自 AI。這未必意味末日,而是一個新開始。真正的程式設計師不會被 AI 替代,而會學會如何讓 AI 成為最強大的工具。就像計算器沒有讓數學家失業一樣,AI 也不會讓程式設計師失業——它只會讓那些拒絕進化的人失業。程式碼即是機器語言,是 AI 的母語,將機器語言交還給機器本身,人類用自然語言描述 Idea,看起來似乎是個更自然的結果。 (極客公園)
阿里深夜開源80B程式設計模型!專攻智能體,周靖人、林俊暘最新成果發佈
個人電腦也能跑出頂級程式設計智能體?今日凌晨,阿里開源了一款小型混合專家模型Qwen3-Coder-Next,專為程式設計智能體(Agent)和本地開發打造。該模型總參數80B,啟動參數僅3B,在權威基準SWE-Bench Verified上實現了超70%的問題解決率,性能媲美啟動參數規模大10-20倍的稠密模型。Qwen3-Coder-Next的主要增強功能如下:1、高效MoE架構:僅需啟動3B參數,可達到與啟動參數數量高出10-20倍的模型相當的性能,包括37B啟動參數的DeepSeek-V3.2、32B啟動參數的Kimi K2.5等,降低視訊記憶體與算力需求。2、更強智能體能力:擅長長段推理、複雜工具使用以及從執行失敗中恢復,在動態程式設計任務中性能強大。3、與真實世界的IDE多樣化整合:其256k的上下文長度,加上對各種腳手架範本的適應性,使其能夠與OpenClaw、Qwen Code、Claude Code、Web Dev、Browser use、Cline等不同的CLI/IDE平台無縫整合,支援多樣化的開發環境。Qwen3-Coder-Next在實際開發中能理解需求、編寫程式碼,還能與環境互動、完成任務,可以在沒有人工干預的情況下生成可玩的網頁遊戲,部署服務並自動測試。阿里在程式設計智能體上進展不斷。就在昨日,阿里雲CTO周靖人、阿里千問大模型技術負責人林俊暘署名的論文在Arxiv平台上發表,為推進下一代程式設計Agent的發展提供了新資源和可靠方法。簡單來說,他們提出了一個可擴展的高效框架SWE-Universe,用於從GitHub拉取請求自動建構真實世界的軟體工程(SWE)可驗證環境。利用一個建構Agent,團隊將真實世界的多語言SWE環境的數量擴展到接近百萬級(807693個)。最後,團隊將該技術應用於Qwen3-Max-Thinking,並在SWE-Bench Verified測試中取得了75.3%的高分。▲論文截圖回到本次面向產業推出的新模型來看,團隊已正式開源Qwen3-Coder-Next(Base)與Qwen3-Coder-Next(Instruct)兩個版本,支援研究、評測及商業應用多種場景。Qwen3-Coder-Next一經發佈引起了廣泛關注,有網友在社交平台X上稱這一模型“尺寸完美”,也有網友表示自己等便攜版的Qwen3-Coder已經很久了。▲社交平台X網友對Qwen3-Coder-Next模型的部分評論01.實測看齊10-20倍啟動參數模型趕超DeepSeek-V3.2儘管啟動參數規模很小,Qwen3-Coder-Next在多項智能體評測上仍能匹敵或超過若干更大的開源模型。該模型在SWE-Bench、TerminalBench 2.0和Aider等多個主流程式設計智能體基準上的表現如下。▲Qwen3-Coder-Next實測表現使用SWE-Agent框架時,Qwen3-Coder-Next在SWE-Bench Verified上達到70%以上,超過了DeepSeek-V3.2,接近GLM-4.7、MiniMax M2.1。在多語言設定以及更具挑戰的SWE-Bench-Pro基準上,Qwen3-Coder-Next同樣超過了DeepSeek-V3.2,還較大幅度領先於GLM-4.7、MiniMax M2.1。在效率方面,Qwen3-Coder-Next與同類模型在SWE-Bench-Pro基準上進行對比分析,每次推理僅啟動3B參數,卻能達到與啟動參數量達其10-20倍的模型相當的基準性能,包括37B啟動參數的DeepSeek-V3.2、32B啟動參數的GLM-4.7、32B啟動參數的Kimi K2.5等。雖然專有的全注意力模型在絕對性能上仍保持領先優勢,但Qwen3-Coder-Next在面向低成本智能體部署的應用場景中,仍能在效率與性能之間取得更優的帕累托權衡。▲Qwen3-Coder-Next實測表現02.創新智能體訓練配方:強化智能體訓練的訊號Qwen3-Coder-Next模型基於Qwen3-Next-80B-A3B-Base建構,採用混合注意力與MoE的新架構;通過大規模可執行任務合成、環境互動與強化學習進行智能體訓練,在降低推理成本的同時,提升程式設計與智能體能力。Qwen3-Coder-Next並不只依賴參數規模擴張,而是將重點放在擴展智能體訓練訊號(agentic training signals)上。團隊使用大規模的可驗證程式設計任務與可執行環境進行訓練,讓模型能夠直接從環境反饋中學習,而非僅依賴靜態文字。訓練過程主要包括:1、持續預訓練:在以程式碼與智能體為中心的大規模資料上進行。2、監督微調:基於高品質的智能體互動軌跡,最佳化模型的行為。3、領域專家訓練:針對軟體工程、問答、Web/UX等特定領域,精細化專家能力。4、專家知識蒸餾:最終將27個專家的能力融合至一個輕量的、可部署的單一模型。這套“配方”的核心目標,是教會模型長時程推理、熟練使用工具,以及從執行錯誤中有效恢復——這些正是實用程式設計智能體所需的核心能力。03.多樣化整合下游應用無人工干預完成遊戲生成部署Qwen3-Coder-Next的價值還體現在於其低部署門檻與應用體驗。得益於僅3B的啟動參數,開發者可靈活將其整合至多種場景:作為本地IDE外掛,實現自動修復與程式碼生成;建構命令列智能體(CLI Agent),通過自然語言操作終端、管理項目;部署於企業內部網路環境,打造私有化、高響應的程式設計輔助系統。“小啟動、快響應、強能力”為程式設計智能體的規模化落地提供了更具可行性的路徑。該模型可整合到多種下游應用中,下文展示其在OpenClaw、Qwen Code、Claude Code、Web Dev、Browser use、Cline等場景中的示例。1、Web Dev:建立聊天介面(Creating a Chat Interface)2、CLI:桌面清理(Desktop Cleanup)3、OpenClaw:建立聊天介面(Creating a Chat Interface)4、Browser Use Agent:在亞馬遜上搜尋商品(Searching for a Product on Amazon)5、coder.qwen.ai:開發一個五子棋遊戲(Building a Gomoku Game)04.結語:研發落地雙投入阿里加碼程式設計智能體程式設計智能體正成為阿里千問團隊的強攻領域。Qwen3-Coder-Next在程式設計智能體基準上表現強勁,展現了技術在實用場景中的應用價值。而周靖人、林俊暘署名的新論文則代表了其程式設計智能體新的前沿進展,形成了研發和落地兩條路快步走的趨勢。展望未來,團隊認為強大的智能體能力,如自主使用工具、應對難題、管理複雜任務,是更好程式設計智能體的關鍵。接下來團隊計畫提升模型的推理與決策能力、支援更多工,並根據使用反饋快速迭代更新。 (智東西)
OpenAI Codex桌面版深夜突襲!一人指揮Agent軍團,程式設計師徹底告別996
太帶勁了!搶先Claude 5,OpenAI深夜祭出了一個編碼殺器——Codex。它可以讓一人指揮多Agent平行協作,自帶Skills,編碼從此進入自動化時代。Claude 5的腳步聲越來越近,奧特曼終於坐不住了。就在剛剛,OpenAI毫無預警地拋出「王炸」——Codex正式進化為獨立的桌面App。這不僅僅是一個寫程式碼的窗口,更是一個能同時指揮千軍萬馬(多個Agent)的「全能指揮部」。Codex定位非常明確:要做Agent的「指揮中心」具體來說,Codex可以做到以下幾點:多工平行切換,毫不費力:同時呼叫多個AI智能體開展工作,並通過「工作樹」(worktrees)實現變更隔離,互不干擾;建立並呼叫Skills:將工具和開發規範封裝成可復用的能力;設定自動化流程:通過後台定時工作流,把那些重複性的瑣事統統交給Codex處理。假設想要為相簿裡的照片加入「拖曳」功能,選擇「工作樹」,即可讓AI在同一倉庫中各司其職。Codex的進化令人毛骨悚然,它不僅生成程式碼,還學會了利用程式碼作為「Skills」來操控電腦。比如想要解決項目中的Comment,直接呼叫安裝好的Skills,Codex立刻就把問題破解了。不僅如此,OpenAI僅憑一句話,就讓Codex消耗700萬 token,徒手搓出一個3D版賽車遊戲。這一次,Codex的誕生,並非是新瓶裝舊酒,更不是一次毫無誠意的「套殼」包裝。它標誌著AI程式設計正式從「對話助手」進化為「指揮中心」。奧特曼激動表示,「真是愛了愛了,它比我想像中還要驚喜」!「AI程式設計師就是不會耗盡多巴胺。他們不會感到沮喪,也不會耗盡能量。它們會一直堅持下去,直到解決問題」。OpenAI總裁Greg牆裂推薦——我多年來一直是終端和Emacs的鐵粉,但自從用了Codex之後,再回到終端簡直感覺像穿越回了過去,代差太明顯了。這種感覺,就像是一個專門為開發而生的AI智能體原生介面。OpenAI Codex代表著一種全新的AI Coding範式,極有可能重塑開發者與程式碼互動的邏輯。甚至,Codex還可與Claude Cowork狂飆能力,把雜亂桌面瞬間清理乾淨。目前,Codex正式在macOS上線,Windows版即將推出。OpenAI還放出了「限時福利」,ChatGPT免費使用者和Go版本也可用上Codex,Plus、Pro、Business、Enterprise和Edu計畫的使用者,速率直接翻倍。編碼殺器Codex APP震撼登場一人指揮所有AgentmacOS版Codex應用,是一個功能強大的新介面。它能讓開發者能輕鬆駕馭多個AI智能體,平行處理任務,並與AI協作搞定那些耗時的大活兒。過去一直以來,開發者和AI的關係是「結對程式設計」,你寫一段,它接一段。如今,Codex的出世將徹底改變軟體建構的方式——人類不再與AI緊密結對,直接給AI委派任務,貫穿於軟體設計、建構、發佈和維護的全生命周期。這一轉變的苗頭,實際上從2025年4月發佈Codex以來,便已初見端倪。開發者與AI的協作方式已發生了根本性轉變。現有模型可以端到端地處理複雜的、長流程的任務,開發者也開始在跨項目中指揮多個AI智能體:分派工作、平行跑任務,並放心地把耗時數小時、數天甚至數周的重大項目交給 AI 。核心挑戰已不再是AI能做什麼,而是人們如何大規模地指揮、監督並與它們協作——遺憾的是,現有的IDE和終端工具並非為此而生。這種全新的建構方式,加上模型能力的提升,呼喚著一種全新的互動載體。這正是OpenAI要推出Codex桌面應用的原因,主打「一個AI智能體的指揮中心」。多智能體平行,狂飆程式碼不亂套Codex為與AI智能體多工平行,建構了一個專注的空間。所有AI在按項目組織的獨立線程中運行,確保你無縫地在任務間切換,而不會丟失上下文。你可以在應用裡直接檢查AI的改動,在diff上寫評論,甚至用編輯器打開進行手動調整。它還內建了對Git worktree的支援,所以多個AI可以在同一個倉庫(repo)上開工而互不衝突。每個AI都在你程式碼的隔離副本上工作,讓你能探索不同的開發路徑,而無需操心它們會如何影響你的主程式碼庫。當AI智能體幹活時,可以把改動拉(checkout)到本地,或者讓它繼續推進,完全不動本地的git狀態。應用會自動從Codex CLI和IDE擴展中同步會話歷史和配置,這樣你馬上就能在現有項目中用起來。解鎖Skills外掛,手搓3D賽車遊戲Codex正從一個只會寫程式碼的AI,進化為一個能用程式碼在電腦上真正解決問題的AI。通過Skills(技能),可以輕鬆擴展Codex的能力。今後,Codex不再侷限於程式碼生成,還能處理資訊收集與整合、問題解決、寫作等任務。Skills就像是打包好的指令、資源和指令碼,讓Codex能可靠地連接工具、運行工作流,並按照團隊的習慣完成任務。Codex應用裡有一個專門的介面來建立和管理Skills。你可以明確要求Codex使用某個Skill,或者讓它根據手頭的任務自動呼叫。OpenAI舉了一個例子,曾讓Codex做一個賽車遊戲——要有不同的車手、八張地圖,甚至還有玩家能用空格鍵觸發的道具。利用圖像生成 Skill(由GPT Image驅動)和網頁遊戲開發Skill,Codex僅憑最初的一個使用者提示詞,就獨立工作並消耗了超過700萬個Token,把遊戲做了出來。它身兼數職,既是設計師、遊戲開發者,又是QA測試員,通過實際試玩來驗證成果。6萬Token可以看到,在只消耗了6萬token的這個版本裡,畫面非常粗糙。很窄的賽道中間,塞滿了撞上去會穿模的「障礙物」。技能箱可以吃,也可以發射,但好像沒有什麼效果。最尷尬的是,你會永遠在「第二圈」無限循環下去……80萬Token在80萬token的版本裡,畫面似乎好了一些,賽道也寬敞了不少,更接近大家平時玩的賽車遊戲了。但是箱子吃到的技能好像沒什麼用,發射出去之後,小車們還是各跑各的……而且依舊會在第二圈陷入循環,永遠跑不完。700萬Token最後這個700萬token的版本,畫質明顯好了很多。不僅有清晰的賽道,技能箱也更精緻了。這次,技能箱確實有用了。比賽剛開始,我們就吃了AI扔出的一個大招,沒有閃。於是,喜提倒數第一,不過,比起前兩個陷入無限循環的世界來說,這次至少能完賽了。從跑評測和盯著模型訓練,到起草文件和匯報增長實驗,OpenAI內部建構了數百個Skills,來幫助多個團隊自信地把以前很難統一定義的工作委派給Codex。Codex應用內建了一個Skills庫,涵蓋了OpenAI內部流行的工具和工作流,下面重點介紹幾個。實現設計:從Figma拉取設計上下文、資源和截圖,並將其轉化為視覺上1:1還原的生產級UI程式碼。管理項目:在Linear中處理Bug分類、追蹤發佈、管理團隊工作負載等,推動項目進展。部署到雲端:讓Codex把你做好的Web應用部署到流行的雲主機,如Cloudflare、Netlify、Render和Vercel。生成圖像:使用由GPT Image驅動的圖像生成Skill來建立和編輯圖像,用於網站、UI原型、產品配圖和遊戲素材。使用OpenAI API建構:在使用OpenAI API開發時,參考最新的文件。建立文件:一套用於閱讀、建立和編輯PDF、電子表格和檔案的Skills,排版佈局專業。使用Vercel和圖像生成Skills更新網站使用電子表格Skill建立表格以生成購物清單使用Linear管理你的Issue Backlog當你在應用中建立一個新Skill時,Codex可以在你工作的任何地方使用它:應用內、CLI或IDE擴展中。你也可以把Skills提交到程式碼倉庫,讓整個團隊都能用上。OpenAI分享的Agent Skills:https://github.com/openai/skills一鍵自動化,24h為你打工Codex可以設定Automations(自動化),按計畫在後台自動幹活。Automations將指令與可選的Skills結合,會按照你設定的時間表運行。當Automation完成時,結果會進入審查佇列,可以隨時切回來查看並根據需要繼續後續工作。設定自動化以定期建立新Skills在OpenAI,團隊一直用Automations來處理那些重複但重要的任務,比如每日Issue分類、尋找和總結CI失敗原因、生成每日發佈簡報、檢查Bug等等。雙人格模式,秒切換開發者在與AI合作時口味各不相同。有人喜歡直截了當、只講執行的搭檔;有人則喜歡話多一點、更有互動感的風格。Codex現在允許開發者在兩種個性間選擇——一種是簡潔務實風,另一種是更具對話感和同理心的風格。兩者的能力完全一樣,只為貼合你的喜好。只需在應用、CLI和IDE擴展中輸入/personality命令即可切換。默認安全,按需配置此外,OpenAI還將「設計即安全」(Security by Design)的理念融入了Codex AI智能體棧的方方面面。Codex 應用採用了原生的、開源且可配置的系統級沙箱(Sandboxing),這就跟在Codex CLI裡一樣。默認情況下,Codex AI 智能體只能編輯它當前工作的資料夾或分支裡的檔案,並使用快取的網頁搜尋。如果需要運行像聯網訪問這類需要更高權限的命令,它會先請求你的許可。你可以為項目或團隊配置規則,允許特定命令自動以提升的權限運行。一切皆由程式碼控制如今,企業和開發者正越來越依賴Codex進行端到端開發。自12月中旬發佈GPT-5.2-Codex以來,Codex的總使用量翻了一番,過去一個月裡有超過100萬開發者使用Codex。下一步,團隊繼續擴展Codex使用場景,包括上線Windows版應用、不斷突破模型能力邊界,以及實現更快的推理速度。OpenAI科學家感慨,過去幾周寫的程式碼比過去幾年還要多。而且,還用Codex修復了Prism多個bug和功能更新在應用內部,OpenAI還將根據實際反饋持續打磨多AI智能體工作流,讓管理平行任務和在AI間切換變得更容易,且不丟失上下文。他們還在為Automations開發基於雲端的觸發器支援,這樣Codex就能在後台持續運行——而不僅僅是在你電腦開著的時候。Codex建立在一個簡單的前提之上:一切皆由程式碼控制。一個AI智能體在推理和生成程式碼方面越強,它在各類技術和知識工作中的能力就越強。OpenAI全家桶然而,當今的一個關鍵挑戰在於,前沿模型的能力與人們在實際中輕鬆使用它們之間存在差距。Codex旨在縮小這一差距,讓人們更容易指揮、監督並將OpenAI模型的全部智慧應用到實際工作中。OpenAI致力於將Codex打造成最強的程式設計AI智能體,這也為它成為能處理程式碼之外廣泛知識工作的全能AI奠定了基礎。附錄在製作上面這款賽車遊戲時,Codex使用的初始提示詞如下(總結精煉版):使用Three.js實現Voxel Velocity作為一個3D體素卡丁車賽車遊戲,只有一種模式:單人比賽(總是3圈,1個人類對7個CPU,所有8條賽道立即在這個模式下可用,沒有進度限制)。建構一個最小的賽前流程,僅包括:賽道(8),角色(8),難度(輕鬆/標準/刻薄),可選的鏡像模式,可選的允許克隆,和開始比賽,加上一個選項菜單和一個賽中暫停菜單(恢復/重新開始/退出)。建立一個街機駕駛模型,具有靈敏的操控,寬容的擦牆碰撞,有意義的漂移作為主要技能,以及一個漂移充電系統,產生精確的加速等級(1級0.7秒,2級1.1秒,3級1.5秒),同時保持基準速度「快但可讀」,並且在寬闊的道路上保持持續的超車。實現正好8個道具,單道具容量,微妙的位置加權分佈,和溫和的效果(最大失控≤1.2秒,最大轉向停用≤0.6秒),創造滑稽的混亂而沒有硬眩暈,加上在加速期間減少50%的越野減速。定義8個角色及其給定的統計資料和AI傾向,實現CPU難度預設和賽道編寫的賽車/變化樣條線,漂移區和危險迴避,以便AI使用多車道寬度進行乾淨的超車,並行布HUD/音訊要素(位置,圈數/最後一圈橫幅,小地圖,道具槽,計時器/分段,可讀的音效,和每個賽道一個音樂循環)。隨後,Codex不斷地被從10個通用提示詞的隨機列表中重新提示,以繼續處理這個問題。其中一個提示詞的例子是:你的工作是加入新功能,使遊戲更接近原作。首先,玩遊戲並確定與原作相比缺少了什麼。然後挑選幾個缺失的功能並實現它們。在每個功能之後,徹底測試它,通過玩遊戲並確認它工作正常。如果你在玩的時候注意到任何錯誤,也要優先修復它們。 (新智元)
可程式設計數位人民幣及其應用場景分析
在全球數字經濟浪潮推動與國際貨幣體系深刻變革的背景下,數位人民幣作為中國法定數字貨幣的創新形態,正憑藉其獨特的可程式設計特性,在跨境貿易結算領域開闢新的發展空間。可程式設計性賦予數位人民幣超越傳統支付工具的智能化能力,通過智能合約實現資金按預設條件自動執行,為解決包括跨境貿易結算等相關場景的效率低、成本高、信任弱、監管難等痛點提供了全新路徑。一、數位人民幣可程式設計的政策依據與合規邊界數位人民幣的可程式設計性並非技術層面的自發創新,而是在國家頂層設計與央行監管框架下的有序探索,一系列官方檔案為其提供了明確的政策依據與發展導向,同時劃定了合規運行的邊界。中國人民銀行在《中國數位人民幣的研發進展白皮書》中明確將可程式設計性列為數位人民幣的核心設計特性之一,指出數位人民幣通過載入不影響貨幣功能的智能合約實現可程式設計性,可根據交易雙方商定的條件、規則進行自動支付交易,促進業務模式創新。這一表述從官方層面肯定了智能合約與數位人民幣融合的合法性,同時強調“不影響貨幣功能”的核心前提,避免可程式設計性超越法定貨幣屬性,為後續應用探索劃定了底線。2025年底央行出台的《關於進一步加強數位人民幣管理服務體系和相關金融基礎設施建設的行動方案》(以下簡稱《行動方案》),進一步細化了可程式設計數位人民幣的發展路徑,明確提出“帳戶體系+幣串+智能合約”的數位化方案,要求升級數位人民幣智能合約生態服務平台,支撐建構智能合約開源生態體系。《行動方案》將可程式設計能力與服務金融“五篇大文章”相結合,明確其在供應鏈金融、跨境結算等場景的應用方向,為可程式設計數位人民幣在跨境貿易領域的落地提供了政策支撐。從政策導向來看,數位人民幣可程式設計性的發展始終遵循“守正創新、合規可控”的原則。官方檔案既鼓勵利用智能合約實現資金管理的精準化、自動化,又嚴格限定其應用邊界——不得改變數位人民幣的法償性,不得用於金融槓桿、代幣發行等違規場景,確保可程式設計能力服務於實體經濟與合規交易需求。這種政策定位為跨境貿易結算場景提供了清晰的合規指引,使可程式設計數位人民幣能夠在風險可控的前提下解決實際業務痛點。二、可程式設計數位人民幣的場景適配條件可程式設計數位人民幣並非適用於所有支付場景,其核心價值的發揮依賴於場景本身的特性與需求。結合數位人民幣“法定貨幣+智能合約”的雙重屬性,適配可程式設計能力的場景需滿足以下四大核心條件,且場景痛點需與可程式設計特性形成精準匹配。第一,資金存在明確的約束性需求。場景中資金需實現定向使用、專款專用或按規則劃轉,傳統模式下依賴人工稽核、事後監管易出現挪用、截留等問題。可程式設計數位人民幣通過智能合約鎖定資金使用範圍、對象或條件,從源頭實現資金約束,適用於此類場景。若資金流轉無明確約束(如日常小額零散消費),則無需載入智能合約,避免技術冗餘帶來的成本增加。第二,交易條件具備可量化、數位化特徵。智能合約的自動執行依賴於明確的觸發條件,這些條件需能夠轉化為電腦可識別、可驗證的資料,且可對接第三方系統(如物流、政務、金融機構資料)實現自動核驗。例如,“貨達簽收”“驗收合格”等具象化節點可轉化為合約觸發條件,而模糊的主觀判斷條件則難以適配可程式設計模式。第三,多方參與且信任成本較高。場景涉及兩個及以上獨立主體,主體間存在資訊不對稱,傳統模式下需通過第三方中介(銀行、擔保機構等)建立信任,導致流程繁瑣、成本上升。可程式設計數位人民幣以“程式碼即契約”替代第三方背書,通過不可篡改的智能合約保障各方權益,降低信任成本與中介依賴,適用於多方協作場景。第四,存在全流程可追溯與合規需求。場景對資金流向的透明度、可審計性要求較高,需滿足監管核查、內部風控或交易溯源需求。數位人民幣本身基於數字帳本實現交易軌跡不可篡改,疊加智能合約後可記錄資金劃轉的觸發條件、執行節點等全鏈路資訊,實現“資金流+資料流+合約執行流”三流合一,滿足合規與審計要求。上述條件相互關聯、缺一不可,共同構成可程式設計數位人民幣的場景適配基礎。只有同時滿足這些條件,智能合約才能充分發揮價值,實現對傳統模式的最佳化升級;反之,若場景缺乏核心條件支撐,可程式設計能力則難以落地或無法產生實質性效益。三、跨境貿易結算場景的適配性與痛點解決能力跨境貿易結算場景天然契合可程式設計數位人民幣的適配條件,其涵蓋的交易流程、參與主體與核心痛點,與數位人民幣可程式設計特性形成高度匹配。通過載入智能合約,可程式設計數位人民幣能夠針對性解決跨境貿易結算中的傳統難題,成為該場景的最優解決方案之一。首先,跨境貿易結算滿足資金約束性需求,適配可程式設計的定向管控能力。跨境貿易涉及貨款、稅費、運費等多類資金流轉,且存在資金用途監管、外匯管理等合規要求。例如,進口企業的貨款需定向支付給境外出口商,出口退稅資金需專款專用。傳統模式下,資金約束依賴銀行人工稽核交易背景、核對單據,效率低下且存在合規漏洞。可程式設計數位人民幣通過智能合約鎖定資金流向,限定貨款僅用於支付指定境外帳戶,稅費按預設比例自動劃轉至稅務部門,實現資金的精準管控與合規流轉,從源頭防範資金挪用、違規結售匯等風險。其次,跨境貿易結算的交易條件可量化、可數位化,支撐智能合約自動執行。跨境貿易流程包含報關、裝船、運輸、簽收、驗收等多個明確節點,每個節點均能生成標準化資料(如報關單編號、提單資訊、簽收憑證、驗收報告等),且可對接海關、物流、銀行等系統實現資料互通。基於此,可將“報關完成”“貨到目的港”“買方簽收確認”等節點設定為智能合約觸發條件,實現“條件達成即自動付款”,替代傳統模式下“單據稽核—人工付款”的滯後流程。例如,出口企業發貨並完成報關後,合約自動觸發部分預付款劃轉;買方收到貨物並確認簽收後,剩餘貨款自動結清,大幅縮短結算周期。再次,跨境貿易結算多方參與、信任成本高的特徵,可通過可程式設計能力有效緩解。跨境貿易涉及買方、賣方、銀行、海關、物流企業等多個獨立主體,不同主體間存在資訊不對稱,且受不同國家法律、監管政策影響,信任建立難度大。傳統跨境結算依賴信用證、托收等方式,需銀行等中介機構介入稽核單據、提供擔保,不僅流程繁瑣、手續費高昂(通常佔交易金額的1%-3%),還存在單據不符導致的拒付、糾紛等風險。可程式設計數位人民幣通過智能合約將多方約定轉化為不可篡改的程式碼,資金劃轉由合約自動執行,無需單一主體主導,實現“去中心化信任”。例如,買賣雙方約定的結算條款、質量標準、違約賠付等內容均寫入合約,一旦出現違約行為(如貨物質量不達標),合約自動觸發賠付資金劃轉,減少糾紛處理成本。最後,跨境貿易結算的合規與追溯需求,與可程式設計數位人民幣的特性高度契合。跨境貿易需滿足進出口監管、外匯管理、反洗錢、反恐怖融資等多重合規要求,傳統模式下資金流向追溯依賴各主體分散記錄,易出現資料斷點、篡改風險,增加監管核查難度。可程式設計數位人民幣的交易記錄不可篡改,且智能合約可完整記錄資金劃轉的觸發條件、執行過程、參與主體等資訊,形成全鏈路溯源資料。監管部門可即時調取合約執行資料與交易軌跡,實現對跨境資金流動的精準監管,同時降低企業合規舉證成本。從實際痛點解決效果來看,可程式設計數位人民幣能夠針對性破解傳統跨境結算的核心難題。傳統跨境結算存在結算周期長(通常3-5個工作日)、手續費高、流程繁瑣、信任風險高、監管難度大等問題,而可程式設計數位人民幣可實現結算秒級到帳、手續費降低80%以上,同時通過智能合約自動化執行減少人工干預,降低糾紛與合規風險,顯著提升跨境貿易效率與安全性。四、可程式設計數位人民幣在跨境貿易結算中的實踐探索與挑戰當前實踐探索進展。近年來,中國在可程式設計數位人民幣跨境貿易結算領域開展了多項試點探索,其中多邊央行數字貨幣橋(mBridge)項目成為核心實踐載體,取得了顯著成效。mBridge項目由中國人民銀行聯合香港金融管理局、泰國中央銀行、阿聯中央銀行共同發起,旨在利用區塊鏈與智能合約技術,建構跨境數字貨幣結算平台,實現數位人民幣與其他央行數字貨幣的跨境互聯互通。截至2025年11月末,mBridge項目累計處理跨境支付業務4047筆,累計交易金額折合人民幣3872億元,其中數位人民幣在各幣種交易額佔比約95.3%,成為項目中最主要的結算貨幣。在mBridge項目中,可程式設計數位人民幣的智能合約能力得到充分應用:通過載入合約實現“貨到港自動付款”“外匯兌換與結算同步完成”等功能,將傳統跨境結算周期從3-5天縮短至秒級,同時降低手續費約85%。例如,中泰跨境貿易企業通過mBridge平台交易時,出口企業裝船並上傳提單資訊後,合約自動觸發人民幣付款,同時完成外匯兌換,全程無需人工干預。除mBridge項目外,國內部分地區也開展了可程式設計數位人民幣跨境貿易結算試點。以上海、深圳等自貿區為核心,部分銀行聯合跨境電商企業推出智能合約結算方案,將“訂單確認—報關—付款—退稅”全流程納入合約管理。例如,跨境電商企業與境外供應商約定,訂單生成後自動凍結對應貨款,報關完成後觸發付款,退稅資金到帳後自動劃轉至企業帳戶,實現全流程自動化、合規化結算。此外,部分商業銀行還探索了可程式設計數位人民幣在跨境供應鏈金融中的應用。例如,針對跨境供應鏈中的中小企業融資難問題,銀行通過智能合約鎖定貸款資金用途,確保貸款僅用於向境外上游供應商採購,同時將貨物驗收、銷售回款等節點與還款計畫繫結,實現“融資—採購—還款”的閉環管理,降低金融機構風控成本,提升中小企業跨境融資可得性。面臨的挑戰與改進方向。儘管可程式設計數位人民幣在跨境貿易結算領域的實踐取得初步成效,但受技術、政策、市場等多重因素影響,仍面臨一系列挑戰,需針對性最佳化改進。技術層面,跨鏈互操作性與系統穩定性有待提升。跨境貿易結算涉及不同國家的央行數字貨幣系統、銀行核心系統、物流平台等,不同系統的技術架構、資料標準存在差異,跨鏈資料互通與資產轉移難度較大。目前,mBridge項目雖實現了部分央行數字貨幣的互聯互通,但針對全球範圍內不同技術體系的適配能力仍不足。同時,區塊鏈技術的可擴展性與隱私保護存在矛盾——跨境交易量大增時,區塊鏈網路易出現擁堵;而過度追求透明性又可能洩露企業商業機密與交易隱私。改進方向需聚焦跨鏈協議研發,建構標準化的技術對接介面,同時採用零知識證明等隱私保護技術,在保障資料安全的前提下實現高效互通;最佳化共識演算法與網路架構,提升系統並行處理能力與穩定性,滿足大規模跨境貿易結算需求。政策與合規層面,國際監管協調與法規適配難度較大。跨境貿易結算涉及多個國家和地區的法律體系、監管政策,不同國家對數字貨幣的認可度、監管規則存在差異,部分國家對數位人民幣的可程式設計特性存在監管顧慮,甚至設定市場准入壁壘。此外,智能合約的法律地位尚未在全球範圍內形成統一認知,合約糾紛的跨境仲裁、執行機制不完善。對此,需加強國際監管合作,推動建立多邊數字貨幣監管框架,協調不同國家的政策差異,明確可程式設計數位人民幣的合規邊界與智能合約的法律效力;積極參與國際數字貨幣規則制定,提升數位人民幣在國際貨幣體系中的話語權,為跨境應用營造良好的政策環境。市場層面,認知度與接受度有待提升,生態體系尚不完善。目前,部分境外企業對數位人民幣的可程式設計特性認知不足,仍傾向於使用美元、歐元等傳統結算貨幣,且缺乏熟悉可程式設計數位人民幣業務的專業人才。同時,跨境貿易結算涉及的物流、保險、報關等配套機構接入程度較低,尚未形成完整的生態閉環,影響可程式設計能力的全面落地。改進需強化市場推廣與使用者教育,通過試點案例展示可程式設計數位人民幣的效率優勢與成本節約效果,提升境外企業接受度;加快推動物流、保險、海關等配套機構系統升級,建構覆蓋全產業鏈的可程式設計數位人民幣生態體系,實現各環節資料互通與協同聯動。風險管控層面,智能合約安全與操作風險需重點防範。智能合約程式碼若存在漏洞,可能被惡意攻擊利用,導致資金損失;同時,合約條款的設計需精準對應貿易約定,若條款存在歧義或遺漏,可能引發執行偏差與糾紛。此外,跨境貿易中的匯率波動、地緣政治風險,也可能影響智能合約的正常執行。對此,需建立智能合約全生命周期管理機制,加強程式碼審計與安全測試,引入第三方審計機構確保合約合規性與安全性;最佳化合約範本設計,提供標準化與定製化結合的方案,適配不同類型跨境貿易的需求;建立風險預警機制,針對匯率波動、地緣政治變化等情況設定合約調整條款,提升風險應對能力。數位人民幣的可程式設計特性為包括跨境貿易結算在內的相關場景帶來了革命性最佳化,其與跨境貿易的場景適配性的核心在於,能夠通過智能合約實現資金流、業務流、資料流的深度繫結,解決傳統模式下效率低、成本高、信任弱、監管難等痛點。在官方政策的明確指引與試點實踐的持續推進下,可程式設計數位人民幣已在跨境貿易結算領域展現出巨大應用潛力,多邊央行數字貨幣橋等項目的成效的驗證了其可行性與優勢。面對技術、政策、市場等多重挑戰,未來需堅持“技術創新與合規可控並重、國內試點與國際合作協同”的原則,持續完善技術架構、推動國際監管協調、建構完整生態體系。隨著可程式設計數位人民幣技術的成熟與應用的深化,其將進一步重塑跨境貿易結算格局,提升人民幣在國際貨幣體系中的地位,為中國對外開放與數字經濟發展提供有力支撐。跨境貿易結算作為可程式設計數位人民幣的最佳應用場景,也將成為數位人民幣國際化的重要突破口,開啟全球數字貨幣跨境應用的新篇章。對於跨境貿易企業而言,儘可能創造條件使用可程式設計數位人民幣,可能是未來突破內卷的最銳利的工具。在這方面,我們願與有識之士同行。 (數字新財報)
再見,人類程式設計師!OpenAI自曝:一行程式碼都不寫了,100%用Codex
【新智元導讀】100%是用Codex寫的。還有內部爆料說,Codex讓他們僅用三天時間就搭出了伺服器,三周就發佈了APP。人類程式設計師,真的要退出歷史舞台了?矽谷的空氣裡再次充滿了躁動,而這一次的震源中心,回到了OpenAI。OpenAI的奇點時刻,也要來了?就在剛剛,X被一條爆料徹底刷屏——Codex,已經正式接管了OpenAI研究員「Roon」100%的程式碼編寫工作!Roon發出了感慨萬千的宣告:程式設計一直很痛苦,然而卻是必經之路。我很高興,它終於結束了。我驚訝於自己竟然這麼快就擺脫了程式設計的陰影,而且一點都不懷念它。甚至我有點遺憾,從前的電腦為什麼不是這樣的。早在去年12月,Claude Code之父Boris Cherny就曾投下一枚震撼彈——自己對Claude Code的貢獻100%都是由Claude Code完成的。這一「套娃式」的自我進化,直接引爆了矽谷的自動編碼狂潮。面對如此巨大的蛋糕,OpenAI顯然不會拱手相讓。如今,反擊已經開始。在剛剛過去的周末,Sam Altman已經公開預告:接下來一個月會發佈一堆關於Codex編碼模型的新產品。社區的風向也開始發生微妙的轉變。一些資深開發者評論道:在90%的情況下,GPT-5.2-Codex都能一次性完成我提出的請求。Claude雖然不錯,但它偶爾會偷偷插入「壞程式碼」;相比之下,OpenAI的新方案更像蘋果——主打一個開箱即用。看來,Codex和Claude Code的大戰,已經一觸即發!人類寫程式碼的時代,徹底結束?OpenAI研究員Roon的這個爆料,也讓網友們直言:AI終於到達了這個奇點!看來,人類直接手寫程式碼的時代,真的結束了。經過多年的模型迭代與資料積累,我們似乎真的站在了一個臨界點上:人類直接手寫程式碼,正在變得不再有任何意義,甚至是一種效率的浪費。在Roon的評論區,人們開始集體對程式設計時代說再見。是的,我熱愛電腦,熱愛軟體開發,對我而言,程式設計只是實現目標的手段,僅此而已。複雜的語法只是是我們為了讓邏輯得以執行而必須付出的昂貴代價。如今,這些中間商終於可以退場了。激進的觀點開始湧現。甚至有人建議,既然不需要人類閱讀程式碼了,我們就該讓模型跳過人類可讀的彙編語言,直接使用機器程式碼。今天的程式設計就像曾經的打孔卡一樣,應該永遠消失了。與此同時,另一個炸裂的消息從OpenAI內部流出——一位研究員爆料,在Codex的輔助下,他們僅用了三天時間,就從零搭建了OpenAI的MCP伺服器,並完成了規模驗證。不僅如此,他們還在3周內推出了Sora的Android應用;此外,還有一大波由Codex建構、甚至由Codex自我稽核的內部工具正在排隊上線。如果沒有Codex的話,很難想像OpenAI能以如此驚人的速度發佈產品。有趣的是,這位大佬似乎還玩起了Claude Code之父的梗:過去30天,我花了大量時間稽核Plan和PR,幾乎沒寫一行程式碼!有人評價,這正是「起飛」第一階段的樣子。而下一步,或許就是真正的端到端AI自主研究。還有人問,確定你們這不是行銷?這位研究者詳細解釋說,絕對不是。具體的使用過程是這樣的:首先,他會花很多時間來撰寫規格說明,並在腦海中構想輸出應該是什麼樣子。然後,會啟動一個「4×Codex」的雲端並行任務。這樣不僅可以一次性看到多種不同的變體,也能補上自己一開始遺漏的細節。接下來,就是讓Codex自己發揮。等它跑完,人類再介入進行測試和驗證。Codex CLI 0.9+來了!既然「人機協作」的範式已經改變,那麼承載這種範式的工具自然也要升級。面對Anthropic在的步步緊逼,OpenAI顯然有備而來。就在今天,Codex CLI連續推送了兩次更新,版本號直接來到了0.91.0。其中,Codex 0.9.0帶來了最受大家期待的功能——Plan Mode(計畫模式)!Code模式是Codex的默認體驗,它的工作方式和其他AI智能體一樣。這點咱們就不多費口舌了。但Plan模式則完全不同,它將程式設計任務拆解為兩個截然不同的階段:第一階段:理解意圖(明確目標、劃定範圍、識別約束條件、制定驗收標準)第二階段:技術規格(生成決策完備的實施方案)在這種模式下,輸出的內容非常詳盡,無需任何後續追問即可直接執行。Plan模式最聰明的地方在於:它堅持「證據優先探索」。在開口問問題之前,Codex會先在你的程式碼庫中進行2次以上的針對性搜尋,檢查配置、Schema結構、程序入口等。此外,Plan模式還可以呼叫全套工具:它可以(並且將會)呼叫各種技能、子智能體和後台終端,從而建構高層級的實施計畫。當Codex確實需要你輸入時,它是結構化的,而且只有關鍵且聚焦的問題:· 儘可能提供選項· 總是包含一個推薦選項(對新手極其友好)· 只問那些會實質性改變計畫的問題為了實現這一互動,它利用了新的request_user_input工具。這個工具會暫停執行流程,拋出一道有針對性的多項選擇題,並支援你在選擇時補充反饋或上下文。更貼心的是,一旦它在任何時候檢測到歧義,尤其是當你在引導它時指令模糊,它會立即停下來確認,而不是盲目執行。現在,開發流程變成了這樣:使用者請求一個計畫 -> AI研究程式碼庫與規劃 -> 針對性詢問使用者 -> AI完善並完成計畫 -> 提示是否執行?但是,程式碼誰來審?看起來完美無缺,對吧?Codex負責思考,Codex負責執行,Codex負責填滿你的GitHub。但就在我們為這種極致的效率歡呼時,一個被忽視的深淵正在腳下裂開——在這個新時代,最大的懸念不再是誰在寫程式碼,而是誰來稽核程式碼。當AI火力全開,每天向倉庫甩出10+個PR時,人類開發者面臨的實際上是一場針對注意力的DDoS攻擊。AI生成程式碼是毫秒級的,而人類理解程式碼上下文是分鐘級甚至小時級的。這種「生產與審查的極度不對稱」帶來了兩個可怕的後果:審查者被淹沒,開始習慣性點「Approve」,Code Review淪為形式。那些看起來能跑、但缺乏系統性思考的程式碼塊,正在像癌細胞一樣在程式碼庫中擴散。利益衝突顯而易見,但我們需要看透這一層。Claude Code的創造者吹捧自己的工具天經地義——這是商業的本能。但作為受眾,我們不能把「Demo裡的完美世界」當成日常。畢竟,Demo不會展示偵錯三小時都找不到的競態條件,也不會展示由於上下文丟失導致的邏輯斷層。除此之外,資料裡還藏著一個迷人的悖論。Ars Technica曾報導稱,開發者對AI工具的使用量在漲,信任度卻在跌。為什麼?因為AI正在跨越「恐怖谷」。以前的AI程式碼爛得很明顯,現在的AI程式碼爛得很隱蔽——它引用了不存在的庫,或者在一個極其邊緣的Case上埋了雷。人們用得越多,踩的坑越多,信得自然越少。正如Jaana Dogan所警示的,我們正在面臨軟體工程「瑣碎化」的風險。100個提交,可能讓GitHub的綠格子很好看。1個架構變更,可能需要三天思考,零行程式碼產出。前者廉價如塵土,後者珍貴如黃金。問題從來不是AI能不能寫程式碼,而是它寫的程式碼,是不是我們系統真正需要的,以及我們是否有能力維護它。這對我們意味著什麼?無論我們是否準備好,這個時代已經來了。對於不同的人群,這意味著完全不同的生存法則。致開發者AI編碼工具不是「即將來臨」,它們已經破門而入。問題在於,如何在不丟失自身核心價值的前提下整合它們。技術大牛們依然在做那些艱難的思考工作,AI只是接過了「打字員」的工作。如果你只會「搬運程式碼」,那你確實該慌了。致非開發者「技術工作」與「非技術工作」的邊界正在消融。Claude Cowork這類工具創造了新物種。曾經需要開發者才能搞定的任務,可能很快只需要你能清晰描述出你想要什麼。清晰描述需求的能力,將成為新的程式語言。最後的話雖然OpenAI的研究員和Claude Code的創造者都在宣稱AI包辦了100%的程式碼,但請記住——那是他們的實驗室環境,不是你的生產環境。唯一可以確定的是,我們正在經歷從「寫程式碼」到「指揮寫程式碼」的不可逆的轉變。而且,正在加速。 (新智元)
186.68%!業績爆表!聚焦晶片產業最鋒利的“矛”
晶片行業傳來重磅資料。據最新資料,今年前20天,號稱全球經濟“金絲雀”的韓國出口半導體總金額達107.3億美元,約合人民幣747億元,同比大幅增長超70%。昨晚,美股晶片股普漲,費城半導體指數漲3.18%,刷新歷史新高。當前的晶片市場,正經歷著一場前所未有的“漲價”風暴。這不是傳統的周期性回暖,而是一場由生成式AI浪潮驅動的結構性變局。據報導,DDR5記憶體顆粒現貨漲幅已超300%,甚至出現單條伺服器記憶體價格突破4萬元的奇觀。儲存巨頭們正以前所未有的議價能力,向市場宣告:高端產能已被AI鎖定,短缺成為當下的常態。這種熱度已迅速從產業鏈傳導至二級市場。作為晶片產業最鋒利的“矛”,晶片設計環節因其高毛利、輕資產、高彈性的特徵,成為當下熱門賽道。科創晶片設計ETF天弘(589070)所跟蹤的標的指數——科創晶片設計指數,年內13個交易日漲幅20.58%,成為市場領漲類股。01 186.68%!聚焦業績爆表的晶片指數從產業鏈角度看,晶片通常分為設計、製造、封測三大環節。其中,設計位於最上游,決定晶片的架構、性能、功耗以及最終應用場景。從全球產業歷程看,晶片設計往往是產業鏈中附加值最高、毛利率最集中的環節。以海外為例,輝達、AMD等公司並不直接參與製造,卻通過持續推出高性能晶片,佔據算力體系的核心位置。國內市場,正在經歷類似的結構變化。在外部高端晶片獲取難度上升、內部算力需求持續擴張的雙重背景下,自主晶片設計能力的重要性被不斷強化。需求並未減弱,反而更加集中地指向一個核心問題——能否形成穩定、可持續的本土供給能力。在算力需求持續放大的時代背景下,晶片設計環節的變化,也逐漸體現在經營資料中。算力需求的擴張,反映在了晶片設計企業的基本面中。以科創晶片設計ETF天弘(589070)跟蹤的上證科創板晶片設計主題指數為例,成份股去年前三季度營收同比增長34.27%,淨利潤同比增長186.68%,淨利潤增速斷層領先同類晶片指數。(本文內容均為客觀資料資訊羅列,不構成任何投資建議)02 20CM新工具!跟蹤市場上優質的晶片設計主題指數科創晶片設計ETF天弘(589070)標的指數的成份股全部來自科創板,單日漲跌幅上限為20%。相較於傳統寬基指數,其價格彈性更高,也更貼近科技成長類股的波動特徵。該指數高度聚焦晶片設計環節,是市場上純正設計主題指數,數字晶片設計佔比約76%,模擬晶片設計佔比約18%,覆蓋AI算力體系中的多個核心方向,包括計算晶片、儲存晶片以及關鍵模擬器件等。眾所周知,晶片設計處於產業鏈利潤分配的頂端。設計公司往往能通過技術溢價獲得更高的毛利回升。相比之下,製造端受資本開支和產能利用率波動影響較大,利潤傳導存在滯後性。在“AI算力自主”戰略下,設計端作為定義晶片架構的源頭,是突破關鍵技術瓶頸的重要環節。從盈利預期看,機構公開一致預期顯示,科創晶片設計ETF天弘(589070)所跟蹤的上證科創板晶片設計主題指數未來兩年的營收和淨利潤增速仍處於較高區間:2025年、2026年指數營收增長率預期分別為38.48%、31.33%,淨利潤增長率預期分別為247.70%、75.42%,整體高於多數同類晶片指數。從歷史表現看,2024年、2025年上證科創板晶片設計主題指數收益率分別為35.54%、60%,在同類晶片主題指數中表現相對突出。這些資料,並不指向短期走勢判斷,而是反映了算力需求擴張、國產替代推進與產業升級多重因素疊加後的階段性特徵。03 把晶片設計,放回更長的時代坐標中當下再討論晶片設計,已經很難只停留在單一行業層面。它所關聯的,不僅是某一細分賽道的景氣變化,更牽動著產業安全、技術路徑選擇,以及長期競爭力的建構方式。從“十五五”規劃對新質生產力的持續強調,到國產算力生態的逐步成形,中國晶片產業正處在一個必須穿越、無法迴避的關鍵階段。問題早已不再是“能不能替代”,而是“能否形成完整、可持續的能力體系”。在這一過程中,晶片設計處於極為關鍵的位置——它定義架構,決定性能,是整個產業鏈的重要環節。資本市場的作用,並非替代產業本身的判斷,而是在這一長期、複雜的演進過程中,提供一種可被理解、可被跟蹤的結構化觀察工具。跟蹤上證科創板晶片設計主題指數的科創晶片設計ETF天弘(589070)於1月23日上市,本質上正是產業演進與市場機制之間的一次銜接:一端,是持續深化的晶片設計能力;另一端,是以指數形式呈現的階段性表達。當算力逐漸演變為基礎設施,當晶片成為時代變數,市場所觀察到的,已不只是某一條賽道的漲跌,而是生產力底座正在發生的系統性變化。在外部環境方面,受貿易摩擦持續影響,高製程晶片及相關裝置的獲取難度不斷上升,上游半導體產業鏈的供給缺口,正倒逼自主可控處理程序加速推進。同時,在“信創”等政策的持續推動下,國內市場資源進一步向國產廠商集中,國產化替代進入加速階段。這一趨勢在核心計算晶片領域尤為明顯。根據Gartner與摩根士丹利的預測,中國雲端AI 晶片市場規模有望在2027年達到40億美元:其中,GPU作為當前AI算力的主力,其國產化率預計將從2023年的24%大幅提升至2027年的82%,在AI訓練與推理等關鍵環節,“卡脖子”問題有望得到階段性緩解。與此同時,隨著AI技術,尤其是AI Agent進入快速演進階段,CPU作為通用計算與任務調度的核心,其產業生態也正迎來關鍵拐點。AI Agent對CPU的需求呈現出明顯的乘數效應:一方面,智能體具備自主修復與反覆嘗試能力,使原本由人工等待造成的時間成本,轉化為持續、穩定的系統計算負載;另一方面,Agent呼叫工具的速度遠超人類個體,短時間內即可生成大量臨時處理程序。隨著智能體逐步普及,CPU所承受的算力壓力將呈幾何級數放大。因此,國產替代的推進正呈現出雙線平行的特徵:一方面,需要在已經出現突破窗口的GPU等專用算力晶片上持續鞏固優勢,實現從“可用”向“好用”的躍遷;另一方面,也必須在CPU等基礎通用晶片的自主設計上加快步伐,以匹配AI新階段對系統性算力的需求。圍繞計算晶片實現全面自主可控,正在成為行業內部逐漸凝聚的共識。這種變化,未必喧嘩,卻足夠深遠。 (ETF進化論)