#2碼
AI時代,深邃的思考與清晰的表達,才是人類最後的護城河
人工智慧,尤其是大模型的快速普及,正在以前所未有的速度重塑人類社會的分工結構。一個越來越清晰的趨勢正在浮現:執行正在被AI接管,而思考與表達,正在回歸人類本身,並變得愈發稀缺。一、從會做事到想清楚事,能力結構正在發生根本轉變在工業時代與資訊時代的大部分時間裡,人類價值高度依賴執行力。誰更勤奮、誰更熟練、誰更快完成任務,誰就更具競爭力。然而,大模型的出現正在系統性地瓦解這一邏輯。今天,大模型可以寫程式碼、生成文案、整理報告、分析資料,甚至完成大量過去被視為高認知含量的工作。只要目標足夠明確、路徑足夠清晰,執行幾乎可以被無限複製、低成本擴展。這意味著:執行力正在商品化技能本身不再稀缺單純會幹活的價值正在快速下降在這樣的背景下,真正拉開人與人差距的,不再是你能做什麼,而是你能不能想清楚要做什麼。二、你想明白的東西,才能被清晰地表達出來思考與表達從來不是兩件獨立的事情。模糊的表達,本質上源自模糊的思考。一個人如果無法用簡潔、結構化的語言講清楚一個問題,往往不是不會說,而是根本沒有想透。真正的思考,是將複雜問題拆解為清晰的邏輯鏈條,是在不確定性中找到關鍵變數,是在噪音中提煉本質判斷。在AI時代,想明白本身就是一種稀缺能力。因為資訊極度過剩,結論卻極度匱乏;工具觸手可及,判斷卻愈發稀缺。三、你能清晰表達出來的東西,才能交給大模型去幹大模型並不理解意圖,它理解的是指令。而指令的質量,完全取決於表達的清晰度。模糊的目標,只會得到泛泛的結果不完整的約束,只會帶來不可控的輸出缺乏結構的描述,只會放大不確定性因此,一個極其重要卻常被忽視的事實是:大模型並不會削弱表達能力的重要性,反而將其放大到了前所未有的高度。只有當你:能清晰描述問題邊界能明確表達目標與約束能結構化地拆解任務你才真正具備讓AI為你工作的能力。從這個意義上講,表達力正在成為人類與大模型之間最關鍵的介面能力。四、未來的人類角色:負責思考與表達,把執行交給AI當執行成本趨近於零,人類的核心角色將發生遷移:人類負責提出問題人類負責做價值判斷人類負責建構認知框架人類負責表達目標與方向而:推演方案生成內容反覆試錯大規模執行將越來越多地交由大模型完成。這不是人類能力的退化,而是一種能力層級的躍遷。人類從操作者,轉向設計者和判斷者。五、AI時代,真正的競爭發生在思考深度與表達清晰度上在AI高度普及的未來世界裡,真正稀缺的,不是資訊,不是算力,也不是技能本身,而是:能在複雜系統中做出深邃思考的人能將複雜思想清晰表達出來的人能用語言與結構駕馭智能系統的人思考力決定你能看到多遠,表達力決定你能調動多大的能力邊界。當執行可以外包給大模型,人類真正的價值,將回歸到最本質的兩件事上:想清楚,以及說明白。 (壹號講獅)
OpenAI發佈GPT-5.2-Codex:號稱工程實戰能力天花板
OpenAI剛剛正式發佈GPT-5.2-Codex,主要針對專業軟體工程和防禦性網路安全最佳化的智能體(Agentic)程式設計模型。相比前代,它在長程任務處理、大規模程式碼重構、Windows環境適配以及網路安全能力上均有顯著提升,工程能力達到實戰天花板目前,付費ChatGPT使用者已可在Codex相關介面體驗,API訪問也將在未來幾周內開啟。開發者可以通過以下命令安裝:$ npm i -g @openai/codexGPT-5.2-Codex是在GPT-5.2的基礎上,吸收了GPT-5.1-Codex-Max的智能體與終端使用能力進一步最佳化而來其核心技術改進包括:上下文壓縮:增強了長程任務的處理能力,使其在大型倉庫中進行跨長時間周期的協作時,能保持全上下文完整,不丟失進度複雜工程處理:在處理大規模程式碼重構、程式碼遷移和功能建構時更具可靠性,即使計畫變更或嘗試失敗,模型也能持續迭代性能表現:在SWE-Bench Pro(軟體工程任務評測)和Terminal-Bench 2.0(真實終端環境評測)中均達到了SOTA(業內頂尖)水平環境適配:顯著提升了在原生Windows環境下的智能體程式設計效率與穩定性視覺增強:模型能更準確地理解螢幕截圖、技術架構圖和UI介面,支援直接將設計稿生成為可運行的原型OpenAI表示,GPT-5.2-Codex的發佈是AI支援複雜軟體工程和專業安全領域的關鍵一步,未來將根據發佈反饋持續擴展存取權具體表現如何,還是要看結合自己的使用才知道 (AI寒武紀)
震動全行業!Google剛剛打出了一張“王炸”:Gemini 3 Flash,徹底終結AI應用的“燒錢”遊戲!
Google剛悄悄上線了Gemini3Flash——要是光看跑分,它可能不是最扎眼的,但要說顛覆性、對明年預算和產品規模化的影響,這模型絕對排得上頭名。我直接說透:它可不光是“快”和“便宜”這麼簡單,Google這是憑著一己之力,用成本結構對整個AI推理市場搞“降維打擊”呢。01 戰略定位:那是“青春版” , 分明是“部署級核武器”!好多人覺得Flash是Gemini3Pro的“性能縮水版”,這理解真的完全跑偏了!從架構來看,Gemini3Flash是直接搭在Gemini3Pro的推理基礎架構上的,根本不是獨立的弱架構——它共享著同樣的推理骨幹,只是專門針對極低延遲和極低成本做了深度最佳化。Google這兒還拋出個關鍵概念:“思考等級”(ThinkingLevels)。作為業內人,這點你可得吃透:以前不管讓模型干多簡單的活,都得為它的“最大推理深度”付費。但現在有了“思考等級”控制,開發者能根據任務需求,精準調控模型的推理程度。這意味著啥?你再也不用為解決一個簡單的圖像識別問題,花解決複雜數學難題的推理費用——這可是對AI經濟模型的一次根本性顛覆。02 核心吸引力:成本“屠夫”上線 , 把“燒錢”變成“印鈔”價格才是這次發佈的真炸彈。把性能和成本標準化之後,Gemini3Flash的競爭力簡直沒誰了。看組資料就知道,這才是真・成本大跳水:輸入(每百萬Token):才50美分輸出(每百萬Token):僅需3美元這價格有多震撼?比Gemini3Pro、ClaudeSonnet4.5甚至GPT5.2都便宜太多。Google的訊號已經很明確了:Gemini3Pro是給那些追求最大推理深度、不在乎成本的場景準備的;而Gemini3Flash,才是Google要你“部署到任何地方”的模型。它不是智能上的“退步”,而是“每決策支出”(SpendPerDecision)上的一次史詩級下降。03 打破低價迷思:多模態與編碼 , 照樣能打!低價可不代表低能——這正是Flash最讓人興奮的地方。它經過最佳化後,在推理、多模態理解、編碼和長上下文任務裡,都能保持穩定的高水準。A.多模態理解:截圖即程式碼生成 , 成本直接大降多模態工作流以前就是“燒錢”的代名詞,但Flash證明了:不用讓成本爆炸,也能實現前沿能力。在評估截圖和UI元素理解能力的ScreenSpotPro基準測試裡,Flash表現特別能打。想像下這個場景:你給它一張Web分析儀表盤的截圖,它能立馬看懂內容,用HTML、TailwindCSS和Chart.js幫你重建功能相似的網頁程式碼,甚至還能自動加UI推理——比如顯示餅圖的數值和百分比這些細節。這就說明,Flash能以極低的成本做截圖分析、UI推理和視覺理解,壓根不用呼叫最昂貴的模型層級。B.通用推理與持續編碼能力專家級分析:在針對高難度科學和特定領域推理的GPQADiamond測試中 , Flash拿了90.4%的高分 , 跟Gemini3Pro差不了多少——這意味著它完全能勝任技術分析、長篇綜合、專家級問答這些研究密集型任務。編碼代理:在LiveCodeBench上 , Flash的性能和Pro在同一水平。更關鍵的是 , 它能支援連續編碼代理 , 還不會讓你的營運成本“炸掉”——這對所有AI軟體工程公司來說 , 絕對是最大的福音!04 該重新審視你的產品策略了!Gemini3Flash最大的價值,是給所有開發者和企業打開了規模化應用的大門。以前設計AI產品,總免不了在“功能強大”和“使用成本”之間糾結來糾結去。現在Flash憑著前所未有的性價比,直接打破了這個困境。它釋放了一個明確訊號:AI應用的黃金時代,不是由性能天花板決定的,而是由成本地板定義的。 (New基地)
37歲、240 億美元!一個在中餐館長大的華裔學霸,登上了最年輕富豪榜
我們見過無數“別人家孩子”的故事,但這位來自《福布斯》雜誌上最新一期的報導,具有能讓所有人都熱血上頭的成長路徑——他的名字叫 Edwin Chen,37歲,做到公司估值240億美元;出身普通,父母經營中餐館;MIT 數學+語言學+電腦三項頂尖專業;沒融資、低調、不開發佈會,卻被全球 AI 巨頭追著合作。他沒有創立爆紅的大模型,也不是炙手可熱的晶片玩家,卻以一種極其“低調”的方式,成為《福布斯》美國最年輕的億萬富翁之一。圖源:Forbes官網最讓我破防的不是他的身價,而是他身上那種“普通家庭也能培養出傳奇”的真實感。這不是雞娃,這是活生生給所有家長續命。1/ 父母經營中餐館,他卻在後廚自學微積分其實許多成功華裔的故事裡,家庭背景並不光鮮,Edwin Chen也是如此。Edwin Chen在佛羅里達州的水晶河長大,這座墨西哥灣沿岸城市以海牛和退休人士而非科技億萬富翁聞名。他的父母從台灣移民到美國,經營著一家中泰美式餐廳,少年時期的他曾在那裡工作。沒有優越教育資源,也沒有名校輔導班,甚至連像樣的課外活動都沒有。但就是這樣一個普通到不能再普通的環境,卻孕育出了一個天才。當別的孩子在餐廳玩耍時,他埋頭在廚房角落裡研究數學——8 歲自學微積分,17 歲考入麻省理工學院(MIT)。更誇張的是,他沒有滿足於讀一個專業,而是同時攻讀了:數學、語言學、電腦科學,這三個加起來堪稱 MIT 最“硬核”的組合。跨學科思維,就是Edwin在這個階段打下的底色。對於家長而言,這樣孩子的故事幾乎太完美了:不是含著金湯匙,而是擁有努力、天賦和堅持。2/ Google、Twitter、Facebook 的工作經歷,讓他看到 AI 世界的“巨大漏洞”畢業後,他先進入矽谷頂級公司:Google ——做資料探勘;Facebook ——做演算法最佳化;Twitter ——做 AI 模型訓練;按一般人的路徑,他完全可以在大廠躺平吃“金飯碗”。然而在每一個職位上,他都遇到了同樣的問題:難以大規模獲取高品質的人工標註資料。那一刻,他意識到:再強大的 AI,如果沒有高品質的資料輸入,它就永遠學不會像人類一樣思考。他厭倦了那些「完全是垃圾」的資料標註。這是整個行業忽視的問題,也是他後來成功的起點。3/ 2020 年,在舊金山的小公寓裡,開始了一個人的創業沒有融資,沒有團隊,沒有資源。他一個人在租來的小公寓裡寫程式碼、搭網站、做客服。某次攀岩時,他偶遇幾位科技公司高管,隨口介紹了自己正在做的資料標註平台。沒想到對方立刻說:“我們正在頭疼資料問題,你能幫我們做嗎?”就這樣,他拿到了人生第一單客戶。創業之後的一年裡,他幾乎每天只做三件事:寫程式碼做標註和客戶溝通但正是這個階段,Surge AI 打磨出了真正的“殺手級能力”:它不是便宜的標註工廠,而是能理解文化、情緒、隱喻、人類表達方式的“人類知識翻譯器”。這才是真正的稀缺。當其他人還在做簡單的“貓和狗分類”時,Surge AI 已經在做:情緒識別諷刺判定文化語境理解複雜語言推理這些,是 AI 最難訓練的部分。此外,Edwin放棄了傳統的銷售與行銷手段,最初通過自己的資料科學部落格進行溝通,這個部落格是他在十多年前業餘時間建立的。圖源www.edwinchen.aiEdwin曾對採訪的記者說,Surge AI的首批客戶正是通過該部落格獲得,早期客戶包括愛彼迎、Twitch及Twitter。4/ 從未融資,卻做到 12 億美元營收、240 億美元估值Surge AI 做對了什麼?答案是——專注 + 專業 + 高價值服務。當整個行業都在追逐演算法、算力,他卻堅持認為:演算法是引擎,資料才是燃料。於是:社交媒體巨頭找他標註情緒,大模型公司找他訓練推理能力,Meta 在一年內向他購買 1.5 億美元的標註服務,OpenAI、Anthropic、Google、Microsoft、Meta,這些全球最頂尖的大模型團隊……幾乎都在用他的資料。更誇張的是:Surge AI 從未對外融資,但營收超過 12 億美元。在矽谷,敢說自己“不融錢”的公司,幾乎絕跡。而他,卻用這樣“反潮流”的方式,建立了屬於自己的護城河。就連Surge AI的官網也是“反潮流”的低調,低調到首頁只有一堆文字,沒有酷炫的UI和精緻的互動效果。圖源:https://surgehq.ai/5/ 他的故事不是因為財富讓人震撼,而是他的成長擊中了家長最應關心的三件事。1)真正的強者,不是靠刷題堆出來的,而是靠“思維結構”塑造出來的。數學訓練了他拆解問題的能力;語言學讓他理解語境、文化與溝通的本質;電腦把這一切轉化為可執行的技術能力。這樣的能力組合,不是分數決定的,而是認知方式決定的。分數固然重要,但決定上限的,永遠是思維體系。2)未來真正稀缺的,是“深度理解世界的能力”。Surge AI 需要的不是重複勞動,而是深度理解。他們招聘語言學家、人類學家、歷史學者,並不是為了“知識多”,而是為了讓 AI 學會——理解情緒、語境、隱喻、文化背景。這些是人類最複雜的能力,也是 AI 最難獲得的能力。未來的優勢,不再來自技能數量,而來自:是否能解釋複雜問題是否能理解不同文化與人群是否具備洞察力與創造力理解力,是下一代的頂級能力。3)決定孩子上限的,不是成績,而是“能否創造新的價值”。Edwin的成功,來自於“看到別人看不到的價值”。別人做資料,他做“人類智慧的數位化”;別人解決眼前問題,他解決行業底層問題。這類能力不是分數訓練出來的,而是:對世界有自己的判斷能從多學科視角看問題能把知識變成新的價值考試衡量的是輸入能力,而未來衡量的是創造能力。真正能改變命運的,是創造,而不是應付考卷。6/ AI 重塑財富,而教育重塑孩子的未來AI 正在發生一場新的“財富重新分配”。但對我們家長來說,更重要的是:孩子是否擁有 AI 時代真正需要的能力?Edwin Chen給我們看到一種新的可能:從小培養邏輯與思維注重語言與表達把文化理解力當作核心能力跨學科融合,而不是單科突破看到他的故事,不是又看到一個“焦慮範本”,而是一個可複製、可參考的“未來教育範本”。在人類與 AI 共存的時代,理解世界、解釋世界、創造世界的人,永遠不會被機器取代。你家的孩子,也完全有可能成為下一個 Edwin Chen。 (十一媽媽up)