#程式設計師
一年後程式設計師將會逐步消失| Boris(claude code技術負責人) 訪談筆記
來源:Lenny's Podcast,2026年2月,約95分鐘一、他自己怎麼用 AI從去年 11 月到現在沒手寫過一行程式碼。每天 10 到 30 個 PR,全是 Claude Code 出的。早上睜眼第一件事:拿手機打開 Claude iOS 的 code tab,把 agent 派出去跑。同時掛著四五個 agent 平行幹活。他在 Instagram 那會兒就是產出最高的幾個工程師之一。不是本來就寫得少。這一點,從去年11月份到現在還手寫程式碼的同學需要反思了(國央企,保密單位啥的沒辦法的不算),國內用不了claude ios app的也要反思了,不過還不晚,從今天起全部借助 agent,多個agent,另外能搞成skill的節能或者能力的都能搞盡快搞。二、他對程式設計的定調"Coding is largely solved." 至少他自己做的那類活,已經解決了。下一步是 agent 不光寫程式碼,還自己提需求。翻 feedback,看 bug report,讀 telemetry,然後跑來跟你說"這幾個可以修""那幾個可以加"。一到兩年後,學一門具體語言沒啥意義了。就跟現在沒幾個人在乎彙編一樣。年底前 "software engineer" 這個詞會開始退場,換成 "builder"。或者乾脆不分了,人人都是 PM 兼碼農。要立即退出程式設計的行列,不要在古法程式設計了,提升效率,程式語言的學習將沒有意義,這一點挺讓人傷心的,但是不能固步自封啊,前進吧。年底前,軟體工程師將會逐步的,徹底退出歷史舞台,這一點其實有點誇張,borris作為全球最頂級程式設計 agent的負責人,說的激進點沒啥問題,不過明年年底前肯定要退出歷史舞台了。三、資料SemiAnalysis 的報告:GitHub 上 4% 的 commit 是 Claude Code 寫的。這還只是公開倉庫,私有的比例更高。年底可能到 20%。增速不是線性的,還在往上翹。Anthropic 內部工程師產出漲了 200%(按 PR 算)。Boris 之前在 Meta 管程式碼質量, 幾百號人折騰一年也就提幾個百分點。對比之下這個數很離譜。這一點是程式設計師們心裡最痛的一個點,github啊,全球開放原始碼的集中地,後續將會有90%以上的程式碼都是由AI完成,這很難接受,難接受但是很合理。四、這東西怎麼來的剛加入 Anthropic 的時候花了一個月各種瞎搞原型,大部分沒出貨。又花了一個月做post-training,瞭解模型底層。他習慣搞清楚你踩的那層下面那層是什麼。第一個原型叫 Claude CLI。給模型一個 bash 工具讓它自己玩。他隨口問"我在聽什麼歌",模型自己就用 bash 翻出來了。他自己都沒想到這問題能答。發內部公告拿了兩個 like。沒人覺得終端裡能長出什麼正經程式設計工具。為什麼是終端?因為開始就他一個人。終端最省事。後來發現這歪打正著——模型迭代太快了,別的介面根本跟不上。終端正好是最"裸"的殼。2025 年 2 月對外發,一開始也不算爆款。好幾個月大家才搞懂怎麼用。Opus 4 之後開始真起飛。大牛也一樣要經歷沒人理睬的時刻,但是依然保持熱情,結果一下就爆了,在整個AI發展事上Borris恐怕會像linus一樣留下美名,雖然有很多安妮紡織機的工人會很反感他,開玩笑,繼續往下看。五、產品哲學1. 潛在需求(Latent Demand)老版本:看使用者拿你產品在幹什麼歪門邪道,然後把它做成正經功能Facebook Marketplace 是這麼來的:40% 的群組帖子其實是買賣東西。Facebook Dating 也是:60% 的 profile 瀏覽是異性非好友。Co-work 更典型:一堆非技術使用者用 Claude Code 種番茄、分析基因組、恢復硬碟照片、看 MRI 片子。那就給他們做個正經產品算了。這就是傳統的軟體開發流程啊,使用者需要什麼,我們就去滿足它。新版本(AI 時代):看模型自己想幹什麼,順著它的勁兒來。別跟它較勁。2. 別給模型套框一年前可能還需要各種編排器、固定工作流。現在給工具和目標就行,讓它自己找路。Claude Code 從頭就定了"模型即產品"。最少的殼,最少的內建工具,讓模型自己決定用啥、按什麼順序。現在claude code的確是最少的殼,最少的內建工具,用著用著模型會自主決定用那個工具,不帶跟你商量的,其實使用者在用的過程中也不斷的完善自己的一堆skills.3. Bitter Lesson通用模型永遠吃掉專用模型。別在小模型、fine-tune、工作流上花太多力氣,下一版模型出來全給你抹平。他的原話:"Build for the model six months from now." 前六個月產品可能很一般,模型一上來直接起飛。如果一開始大家就知道,通用模型會吃掉專用模型,很多的資金就可以節省下來,很多創業的小夥伴就可以好好的了,不得不佩服段永平先生的一個神觀點:敢為人後,AI初期,攻城略地很有意義,但是觀察整個行業,在合適的時候出手沒問題,不要一開始就跑馬入場,很可能成炮灰,但是學習,持續的觀察整個行業動態是必須的,前置的。4. 少給資源人少反倒逼著人用 AI 想辦法。一個人扛一個項目,自然就想快點出貨。AI 給你加速,不需要老闆在後面催。後邊一個老闆帶著一個有編碼經驗的老碼農就行了,這也是碼農的福利了,一個碼農要兼PM,設計以及測試(其實增加一個測試skill就可以了),老闆在市場衝鋒陷陣,後邊一個碼農就是一個產研團隊,給老闆提供充足的支援。5. 反饋飛輪內部有個 channel 全是吐槽。Boris 早期是有人反饋幾分鐘內出 PR。讓人覺得自己說了算,反饋就越來越多,飛輪就轉起來了。現在 Claude 自己替他幹大部分。激情四射的Borris!六、安全:三層底層:mechanistic interpretability(機制可解釋性),直接看神經元在幹嘛,追蹤"欺騙神經元"之類的東西。Chris Olah 是這個領域的開創者。中層:evaluations,實驗室環境的安全評估。上層:丟到真實世界,看它在野外的表現。所以產品發佈經常叫 "research preview",不是噱頭,是在收真實資料。"Race to the top":把 sandbox 開源了,任何 agent 都能用。想讓行業在安全上捲起來,別比爛。安全是必須要考慮的,AI時代安全比網際網路時代的安全更隱蔽,而且現在在很初期的階段,,前兩天發生了一起使用者用cursor + optus 4.6刪除使用者生產資料庫造成損失的案例,我別的文章有詳細報導。見AI9秒刪庫事件:程式設計師必學的5條安全教訓七、工程師這個角色的去向Cursor 插曲:2025 年中加入 Cursor,兩周走人。原因簡單——他想念 Anthropic 的使命。Cursor 做的事很酷,但他需要工作綁在一個更大的意義上,不然自己待不住。他學程式設計的起點:中學給圖形計算器寫程序,為了數學考試作弊。後來寫了個通用求解器賣給全班,大家一起被抓。老師沒讓他們畢業。從頭到尾程式設計就是工具,不是目的。也承認有人就是愛手寫。隊裡有工程師周末還手搓 C++,就是享受。"以後還會有空間,就像現在還有人寫鋼筆字。"給學生:學校別光盯著程式碼。去學系統架構、產品、設計、商業。以後最搶手的人不是最會寫程式碼的,是能跨好幾個領域、知道到底該造什麼的人。程式設計師同學們,這是個哲人啊,程式設計永遠是工具,不應該是目的,不能贊同更多。或許,以後網路直播手寫程式碼也會成為一個流量的噱頭。還在學電腦沒畢業的孩子們,要去看看這篇文章的原視訊,看看Borris的更詳細的說明,要學架構、產品、設計、商業。後續的人才必須是跨學科的,應該不是說人才,而是普通的打工人也要是跨領域的,一招鮮,吃遍天的時代徹底終結了。八、印刷術這個類比1450 年代以前,歐洲識字率不到 1%。所有文字活全交給抄寫員(scribes)。古騰堡之後 50 年,產出的印刷品比之前一千年加起來還多。成本降了一百倍。200 年後識字率從 1% 到了 70%。沒有印刷術就沒有文藝復興——沒人識字你傳播什麼。有個歷史文獻挺妙的:當時有抄寫員被問到對印刷術的看法,說很高興終於不用抄書了,可以專心做插畫和裝訂(那些更有意思的活)。Boris 把自己跟這個比:不用再折騰配環境、調依賴、修編譯錯誤那些破事了。時間花在跟使用者聊、想方向、跟團隊碰。長期看:程式設計從少數人的手藝變成人人都有的能力,能釋放出什麼?猜不到,但樂觀。短期看:會疼,會有人被淘汰。這是全社會的事,不該一家公司拍板。古騰堡是西方近代印刷術之父,borris舉這個例子就是說明,碼農終於不用手寫程式碼了,終於可以利用自己的頭腦,借助AI做很多自己喜歡做的事情,但是陣痛是不可避免的,長期來看是正向的,積極的。九、對程式設計師說的實在話用最強模型。Opus 4.6 + maximum effort。便宜模型來回修反而更費 token。八成任務先開 plan mode。原理土到掉渣:就是注入一句"先別寫程式碼"。計畫對味了再讓它跑,4.6 下幾乎一把過。給工程師拉滿 token。單人實驗的 token 費遠低過他的工資。真跑出好東西再最佳化成本。各種介面都試試。terminal、desktop app、手機端,那個順手用那個。這不是個純終端工具。多開幾個 agent 平行跑。別一次只跑一個。別怕,去玩。泡在工具最前沿,這是唯一不掉隊的方式。這段既是在宣傳自己的產品,雖然不用宣傳也知道你是最強的,也是在告訴大家一個道理,最貴的可能是最便宜的,而最便宜的可能才是最貴的。我喜歡這種自信。十、零碎但有意思的他生在烏克蘭奧德薩,主持 Lenny 也是。倆人訪談中途當場認老鄉。爺爺是蘇聯第一批程式設計師,用打孔卡寫程序。他媽小時候拿打孔卡當塗鴉紙。進 Anthropic 之前在日本的鄉下住了好幾年,鎮子上唯一寫程式碼的、唯一說英語的。會做味噌。白味噌三個月起,紅的要兩到四年。說是他練耐心用的,也是 AGI 之後的退休方案。書單:《Functional Programming in Scala》(他說是最好的技術書,雖然你可能不寫Scala 了)、《Accelerando》(Charles Stross,節奏和現在 AI 這波一模一樣)、《流浪地球》短篇集(說中國視角的科幻跟西方完全不同,看著新鮮)。格言:use common sense。別看到流程就跟著跑,別看到大家都在做就覺得對。聞著不對勁,它就是不對勁。就這些,這是一個頂級極客,也是一個有意思的很自信的人,碼字不易,歡迎大家點贊推薦打賞三連,原視訊細節更多,歡迎去看。 (米斯特太陽)
Google宣佈:75%的程式碼由AI寫,程式設計師去那兒了?
01 Google宣佈:75%的程式碼由AI寫,程式設計師去那兒了?4月23日,GoogleCEO桑達爾·皮查伊在拉斯維加斯的Google Cloud Next大會上,拋出了一顆炸彈。他說:Google內部新編寫的程式碼,75%由人工智慧生成,然後再交給人類工程師稽核。一年半前,這個比例是25%。也就是說,在18個月的時間裡,Google工程師的工作內容,發生了一次根本性的轉變。以前,他們寫程式碼。現在,他們審程式碼。這件事,表面上是一個技術公司的內部管理變化。但往深處看,它意味著整個軟體行業的用工邏輯,正在被重寫。02 Google的工程師去那兒了?先說清楚一件事:Google並沒有因為75%的程式碼由AI寫,就把75%的工程師裁掉。那工程師們在做什麼?皮查伊給出了一個詞:稽核員(reviewer)。以前的工程師,主要精力花在"寫"上——思考演算法、敲擊鍵盤、偵錯Bug。現在的工程師,主要精力花在"判斷"上——AI給出了三種方案,那一種在性能、可維護性、安全性上綜合最優?Google內部有一個真實案例。他們有一項複雜的程式碼遷移任務,過去完全依靠人工,費時費力。今年,用智能體和工程師協同完成,速度比一年前快了6倍。不是工程師變強了,是工程師開始"指揮"AI了。但這裡有一個更微妙的變化,很多人沒有注意到。Google內部最近允許DeepMind的部分員工使用Anthropic的Claude Code工具,而不僅限於自家的Gemini模型。這在內部引發了一定的緊張情緒——畢竟,用競爭對手的工具做自家的產品,在情感上很彆扭。但Google還是開了這個口子。原因很簡單:誰的工具好用,就用誰的。效率優先。03 一場正在發生的轉型,但沒人告訴你怎麼過關最近,我跟幾位在大廠的朋友聊過這個話題。一位在某網際網路公司做了7年Java開發的工程師說:他們組最近引入了AI程式設計工具,需求排期從以前的兩周壓縮到了3天。但問題來了——他發現自己越來越像個"程式碼檢查員",而不是"程式碼創造者"。"我的核心競爭力還剩下什麼?"他問我。這是一個非常好的問題。根據GitHub Octoverse 2025的報告,使用AI輔助工具的開發者,程式碼產出量提升了55%。但與此同時,初級開發者的崗位需求下降了22%。資料很清晰:AI提升了效率,但淘汰了入門門檻低的崗位。IBM的做法或許更能說明趨勢——他們宣佈將入門級招聘規模擴大至3倍,但要求:必須會用AI工具。不是招更多基礎程式設計師,是招"會使用AI的程式設計師"。企業不再需要5個初級程式設計師,而是需要1個能指揮AI的高級程式設計師。問題不是"AI會不會取代程式設計師",而是"不會用AI的程式設計師,會被會用AI的程式設計師取代"。04 新的考核標準,已經寫進績效表裡Google這次的動作,還有一個細節被很多人忽略了。他們把AI工具使用目標,寫進了工程師的年度績效評估裡。這不是"建議你用AI",這是"你必須用,用了多少是考核指標"。這是一個訊號。當一家公司把某個工具的使用頻率寫進KPI,意味著什麼?意味著這家公司認為:不用這個工具的人,是在主動降低自己的價值。回顧歷史,類似的事情發生過。2000年代初,Excel和資料庫工具普及時,不會用電腦的會計被慢慢淘汰。2010年代,移動網際網路爆發時,只懂PC端的產品經理開始掉隊。2026年,AI工具全面滲透時,不會用AI協作的工程師,正在走向同樣的命運。這不是危言聳聽,這是一個規律。05 寫在最後:該怎麼做?我不打算給"AI會不會取代程式設計師"這個問題一個確定的答案。但有三件事,我認為是確定的。第一,AI正在改變"寫程式碼"這件事本身的價值權重。當75%的程式碼由AI生成,會寫程式碼已經不是稀缺能力。稀缺的是:能判斷程式碼好壞,能設計系統架構,能在AI給出的多個方案中做出正確選擇。第二,使用AI的能力,正在成為職場硬門檻。不是軟實力,不是加分項——是標配。Google、Meta、Snap的動作,已經說明了這一點。第三,變化已經在發生,但機會窗口還沒關上。Q1裁員78557人,有人被淘汰。但IBM逆勢擴招3倍,Cognizant宣佈不裁反而大規模培訓AI工具使用。被淘汰的是不願改變的人,被擴招的是主動擁抱變化的人。皮查伊說,Google正在轉向"真正以智能體為核心的工作流程"。這個方向,不會因為某個工程師不接受而停下來。問題只有一個:在這個轉變完成之前,你打算站在那一邊? (碼農菜菜)
中國網際網路大廠35歲程式設計師:五條現實路徑,總有一條是你的光
最近一位在網際網路大廠工作了十二年的朋剛過完35歲生日。他說,以前過生日是慶祝,現在是“渡劫”。辦公室裡,比他年輕的同事越來越多,討論的話題從技術架構變成了學區房和“35歲紅線”。他半開玩笑地問:“你說,我要是被‘最佳化’了,能去那兒?”這絕不是個例。中國網際網路行業,就像一個巨大的青春能量場,用高薪買斷年輕人最黃金的十年。但當年齡數字悄然爬升,許多人發現,自己似乎站在了一個看不見的十字路口。今天,我們就來系統梳理一下,那些35歲以上的大廠程式設計師們,最終都流向了何方?這五條典型的路徑,或許能為你我點亮一盞前行的燈。路徑一:金字塔尖的“倖存者”(約10%)能走到這裡的,是真正的“天選之子”。他們通常擁有兩項稀缺資產:卓越的技術天賦,以及至關重要的“項目運氣”。在關鍵時期,恰好參與甚至主導了公司的核心項目,一戰成名。他們的頭銜變成了“首席架構師”、“資深技術專家”,年薪範圍在80萬到200萬之間,是普通人眼中的“人生贏家”。但這條路的殘酷在於,它極度依賴個人稟賦與時代機遇的共振。另一條窄路是轉型為管理者,這不僅需要技術過硬,更考驗人際關係處理、團隊激勵的“軟天賦”。一位從大廠技術總監轉型為某中型公司VP的朋友坦言:“管理崗的‘安全墊’更薄,一次核心團隊流失或領導變動,就可能讓你多年積累歸零。”路徑二:中小廠的“技術續命”(約30%)這是最大的一條分流路徑。離開一線大廠的光環,降薪加入成長中的中小公司或傳統企業的數位化部門。表面看是“退一步海闊天空”,實則挑戰重重。首要挑戰是“技術堆疊重設”。大廠往往有自研的、龐大而封閉的技術體系,員工如同精密儀器上的“螺絲釘”,深度有餘而廣度不足。到了需要“全端”作戰的中小廠,從前端到維運可能都要重新撿起。更現實的是心理落差,從參與億級使用者項目,到為幾十萬使用者的產品操心,這種價值感的轉換需要強大的內心調適。不少人在這裡陷入“創業-失敗-再就業”的循環,尋找那個微妙的平衡點。路徑三:教育賽道的“薪火相傳”(約15%)“自己會”和“教會別人”是兩碼事。這是許多轉型進入IT培訓機構或高職院校任教的程式設計師最深的體會。他們的核心能力,從與機器對話的“編碼”,轉向了與人溝通的“教學”。這份工作的吸引力在於穩定的節奏、清晰的假期,以及“桃李滿天下”的成就感。但收入落差是現實的,從大廠動輒百萬的年包,到可能二三十萬的課時費,需要家庭財務提前做好規劃。一位前大廠演算法工程師,現在某知名線上教育平台擔任主講,他說:“最大的快樂,是看到評論區有學生說‘聽懂了’。那種價值的傳遞,比寫完一段優雅的程式碼更讓我滿足。”路徑四:體制內的“風險避險”(約30%)考公、考編,或進入國企、央企的資訊化部門,成了越來越多人選擇的“避險池”。收入可能遭遇“腰斬”,但換來的,是前所未有的穩定性和對個人時間的掌控力。一個有趣的現像是“乙方轉甲方”。曾經作為大廠員工,為某個政府或國企項目提供技術服務,是“乙方”;如今通過考試或招聘進入該單位,成了“甲方”。這種角色反轉,帶來了截然不同的工作視角和心態。一位進入某政策性銀行科技部的朋友說:“現在開會,我聽乙方供應商講方案,常常會心一笑。他們PPT裡畫的‘餅’,我當年也畫過。”路徑五:全球化的“遠端接單”(約15%)這是一條門檻較高但充滿想像力的路。憑藉紮實的技術功底和逐漸補上的英語能力,通過Upwork、Toptal等平台,或熟人網路,承接歐美公司的遠端開發項目。優勢很明顯:按小時或項目計費,單價往往高於國內,且能真正實現“地理自由”。但挑戰同樣具體:需要適應晝夜顛倒的會議時差,在非同步溝通中保持高效,並且技術堆疊必須與國際主流接軌。這要求從業者始終保持極強的自驅力和學習能力。一位專為矽谷初創公司做遠端架構評審的工程師說:“我的競爭對手不再是國內年輕人,而是全球的同齡人。這逼著我必須一直站在技術前沿。”穿越周期:比規劃路徑更重要的三盞心燈梳理完這五條路徑,你會發現,35歲危機,本質上並非年齡問題,而是網際網路這套精密系統設計下的“人力資本加速折舊”機制。高薪購買你的黃金十年,再通過高強度、長通勤、“螺絲釘化”分工,完成自然篩選。因此,比焦慮“該選那條路”更迫切的,是點亮三盞心燈:第一盞,提前佈局“第二曲線”。 不要在風平浪靜時忘記修船。無論是發展副業、深度學習某一垂直領域技術,還是經營個人品牌、積累行業人脈,這些動作最好在30歲左右就開始。你的“備選項”越多,面對變化時就越從容。第二盞,精心維護“弱關係網路”。 很多時候,機會不來自身邊熟悉的同事,而是那些許久不聯絡的前同事、行業會議上有一面之緣的朋友。定期、真誠地維護你的弱關係網路,它可能在你最需要的時候,成為關鍵的資訊源或推薦人。第三盞,堅決守住“健康基本盤”。 這聽起來像是老生常談,但卻是所有一切的根基。長期的熬夜、高壓、缺乏運動,是在透支未來的可能性。保持規律作息、適度鍛鍊,不僅是為了身體,更是為了維持清晰的頭腦和穩定的情緒,以應對更複雜的職業挑戰。生活從來不是單行線,網際網路也並非人生的全部。35歲,或許不是下坡路的開始,而是你積累的行業經驗、人生閱歷真正開始發光的時候。關鍵在於,你是否願意主動走出那個被定義好的“工位”,去探索更廣闊的人生地圖。希望這五條路徑的描摹,能為你帶來一些啟發,而非焦慮。每一條路上,都有人走出了自己的精彩。你最認同那一條,或者你正在那一條路上探索? (leo張大志)
一人幹翻2000人大廠!41歲程式設計師靠AI年入4億美元,奧特曼:我想見他
【新智元導讀】奧特曼「一人公司」神預言,真被幹成了!41歲大佬僅靠2萬本金,帶著AI大軍瘋狂輸出,全年營收4億刀,直接把上市公司按在地上摩擦!一人十億美元公司誕生,奧特曼終極預言成功了!今早,41歲的洛杉磯大神Matthew Gallagher,向全世界詮釋了什麼叫真正的「AI時代超級個體」。2個月,2萬美元啟動資金,外加十幾個AI,徒手搓出年產4億美元的醫療公司。Matthew營運的「手法」堪稱暴力——底層程式碼是AI寫的,前端的網頁文案、廣告圖、推廣視訊全是AI生成的。甚至,就連最吃人力的複雜「業務分析系統」,以及7x24小時線上客服,皆由Agent包圓。在這個「一人公司」狂飆的第一年,營收就衝破了4.01億美元。直到最近,Matthew才終於雇了唯一一名全職員工——他的親弟弟 Elliot。今年,這對兄弟立下了一個更驚人的Flag:帶著龐大的「Agent軍團」,劍指18億美元營收!消息一出,全網瞬間沸騰。這個41歲男人的瘋狂實驗,讓整個矽谷都看懵了,就連Greg親自下場點贊。一人公司,超級個體,就是現在了。一人十億美元公司,奧特曼神預言2024年,奧特曼曾在一次採訪中,做出過一個大膽的預測——未來,一定會出現一家,只有一人的十億美元公司。放在當時,這聽起來完全是痴人說夢!但僅僅兩年後,41歲的Matthew Gallagher就用一場堪稱暴力的創業實驗,把這個神級預言硬生生砸進了現實。就在今天,紐約時報的一紙長文轟炸,在整個矽谷圈投下了一枚深水炸彈——AI是如何幫一個男人(和他的親兄弟),徒手捏出一家18億美元公司的?故事的起點,在2024年9月。拿著僅有的2萬美元,Matthew的遠端醫療公司Medvi悄然上線,主攻吸金能力極強的GLP-1減肥藥市場。沒有豪華寫字樓,沒有龐大的初創團隊。Matthew每天就窩在洛杉磯的公寓裡,熟練地指揮著一支「AI大軍」:程式碼與開發:交給ChatGPT、Claude、Grok組成的AI程式設計師;文案與視覺:讓Midjourney、Runway批次生產網頁、海報和視訊;客戶服務與互動:派ElevenLabs AI語音助手頂上,全天候處理溝通;業務分析:打造專屬的AI業務分析系統,即時盯盤公司的運轉表現。他的核心策略非常清晰:把能交給AI的工作,全部交給AI。甚至,Matthew克隆了自己的聲音,讓AI替自己打電話預約生活瑣事,以便將全部精力用在工作上。淨利6500萬,干翻一家上市公司第一個月,300個客戶。第二個月,再加1000個。到2025年底,Medvi全年銷售額達到4.01億美元,累計服務了25萬名客戶。2026年,這個數字預計會飆到18億美元。而整家公司的正式員工只有兩個人:Matthew Gallagher和他弟弟Elliot。Medvi財務資料顯示,目前日收入超300萬美元,2025年淨利潤率達到16.2%,約6500萬美元。作為對比,上市公司Hims & Hers同年的淨利潤率只有5.5%,有2442名員工。奧特曼在看到報導後回了一封郵件,說他在那個CEO賭局裡「應該贏了」,還表示很想見見這個人。「野生」程式設計師,逆襲成功實際上,Matthew的童年並不「體面」。他跟著家人輾轉住過汽車旅館和車裡,12歲時才在辛辛那提安定下來。叔叔給了他一台筆記型電腦,他自學程式設計,第一個項目是做了一個「Weird Al」Yankovic的粉絲網頁。十幾歲時,他就開始給本地商家做網站,在eBay上賣蠟燭和武士刀。18歲,他還把自建的「虛擬主機業務」以6000美元的價格賣掉。大學讀了兩所都沒畢業,2010年跑到洛杉磯想當演員,最後又回到了寫程式碼的老路上。2016年,他創辦了Watch Gang,一家做手錶訂閱盒子的公司,雇了60個人,有粉絲、有流量,但始終沒賺到錢。2022年ChatGPT發佈後,Matthew開始研究AI工具。兩年後,他遇到了CareValidate的聯合創始人Jiten Chhabra。CareValidate做的事情相當於「遠端醫療基礎設施包」,提供線上醫生網路、處方系統、藥房配送等一整套能力。另一家類似的平台,叫OpenLoop Health。於是,Matthew看到了機會:用AI搞定品牌、行銷和客服,醫生、藥房、合規、配送全部交給這兩個平台處理。同時,他選擇從當時最火的GLP-1減肥藥切入。AI亂報藥價,他竟照單全賣Medvi上線後,增長速度把合作夥伴都嚇到了。CareValidate的Chhabra回憶說,他曾問Matthew,「你後面是不是藏了一支團隊」?然而得到的回答是——沒有。OpenLoop的CEO Jon Lensing則評價說,Matthew的母語似乎就是AI。當然,翻車的地方也不少。AI客服聊天機器人會隨機編造藥品價格,他選擇照單全收,按機器人報的價賣。機器人還會產生「幻覺」,告訴客戶Medvi賣防脫髮藥,實際上,根本沒有這個產品。最要命的是,如果客戶堅持要跟真人說話,聊天機器人被設定為直接轉接到Matthew的手機上。這導致他一個人接了超過1000個客服電話。還有一次,他改了網站上一個小功能然後去爬山了。半路接到廣告代理商的電話,說已經一個小時沒有新訂單了。他意識到更新把什麼東西搞壞了,身邊又沒有任何人可以幫忙修,只好從山上一路狂奔回家。那次當機讓他損失了大約200個潛在客戶。衝刺18億目標,但也孤獨經歷了Watch Gang的教訓,Matthew對「招人」這件事非常警惕。60個員工並沒有幫Watch Gang增長,反而抬高了成本、拖慢了決策節奏。所以Medvi的人員結構極其精簡:兩名合同制工程師,加上2025年4月正式入職的弟弟Elliot。Elliot的工作主要是幫哥哥過濾和攔截各種溝通,讓他能集中精力幹最重要的事。他還用AI克隆了自己的聲音,用這個語音分身打電話預約日程,省下更多時間工作。除了洗澡、睡覺和陪兩個孩子,他幾乎所有時間都泡在Medvi上。隨著公司成長,Matthew逐步把一些專業事務從AI工具切換到了真人服務:法律事務從LegalZoom換成了律師事務所,財務從AI記帳工具換成了會計師事務所。但核心營運依然高度依賴AI。2026年2月,Medvi上線了男性健康產品線,包括ED治療藥物。第一個月就獲得了5萬名客戶,預計四個月內會超過GLP-1業務的規模。3月,又加了健康餐配送服務。接下來還計畫做女性健康、激素治療、防脫髮、保健品和護膚產品。Matthew說他曾考慮通過收購來擴張,但想了想覺得自己用AI造出來也一樣快。風投公司Upfront Ventures的投資人Kobie Fuller曾建議他:如果不缺錢,就不要融資。到目前為止,Medvi的總利潤在7000萬-8000萬美元之間。Matthew拿出100萬美元成立了一個基金會,捐給了洛杉磯的一個貓咪救助機構,還計畫資助幫助無家可歸年輕人的非營利組織。他的目標是,最終把Medvi的大部分利潤都通過基金會來運作。這個從拖車公園走出來的人說了一句很動情的話,「這是我第一次不再為生存而焦慮了」。不過超級精簡的團隊也有代價,他坦言自己開始「感到孤獨」。為了緩解這個問題,Medvi開始給部分客戶配備真人客戶經理。這7個合同制客戶經理每人管理數百名客戶關係,會記住客戶的生日、孩子的名字這些細節。而他們管理這麼多客戶關係的方式是什麼?當然也是用AI。「超級個體」時代來臨Medvi的案例之所以引發巨大關注,在於它驗證了一個此前只停留在預言階段的命題:AI可以讓一個人,建起一家年收入接近20億美元的公司。但仔細看下來,Gallagher並非什麼都靠AI完成。醫療合規交給了CareValidate和OpenLoop,法律和財務交給了專業機構,廣告投放交給了媒體代理商。他真正用AI替代的,是傳統公司裡需要大量人力的中間層——開發、設計、客服、資料分析、內容生產。它證明的核心邏輯很簡單:在AI工具足夠強大的今天,限制一家公司規模的瓶頸,是創始人的認知邊界和執行速度。奧特曼說他想見見這個人。坦白講,誰不想呢? (新智元)
阿里聯手中山大學放狠話:75%的Agent都在造“屎山”!233天連環大測,程式碼庫全崩了!自研新基準:GLM表現亮眼!網友:程式設計師飯碗保住了!
剛剛,一篇阿里聯合中山大學的研究在 X 上爆火了!今天一早,一位微軟產品故事講述者、前Google負責人級布道師 Priyanka Vergadia 分享了一則 X 帖子迅速走火,短短一天內獲8700+點贊、170萬+瀏覽。這篇高贊帖子描述了一項來自阿里巴巴團隊的研究,它是一場 233 天、總消耗達 100 億 token ,在真實生產環境中對主流的 8 家模型廠商提供的 18 個智能體的“耐力”實驗,最終證明了 AI 不會搶走人類開發者的飯碗!Priyanka 總結說:AI 只是編寫了一些遺留程式碼,未來十年你都得忙著修復它們!而一位業內人士對此表示,該項真正的重點在於:阿里團隊做了一個真正有意義的評分體系!小編這就帶大家看下這篇研究。戳破泡沫:一次性修復不叫“程式設計”,那叫“撞大運”該篇論文的名稱是《SWE-CI: Evaluating Agent Capabilities in Maintaining Codebases via Continuous Integration》,由阿里巴巴集團與中山大學聯合完成。論文拋出了一個業內都有明顯體感,但沒人著手思考解決的“長期軟體評估”問題:現在的AI Agent,在 HumanEval 或 SWE-bench 這種“單向考試”裡刷分刷得飛起。只要給它一個明確的Bug,它就能咔嚓一下修好。但現實開發的現狀是: 程式碼是“活”的。今天你修了一個Bug,明天產品經理改了需求,後天底層依賴庫升了級。這一過程並不能被靜態、一次性的修復範式所刻畫。阿里和中山大學的研究團隊提出來一種新的性能標準: 衡量一個 AI 牛不牛,不看它能不能修好眼前的Bug,而要看它在長達半年的項目演進中,能不能不把程式碼庫搞崩。SWE-CI:233天、耗費百億token的“極限耐力賽”因此,為了測試AI的真實“抗壓能力”,研究團隊祭出了一種基於持續整合(Continuous Integration)流程建構的倉庫級基準:SWE-CI,首次將軟體工程評估從“一次性快照”轉向“長期演化”。該基準包含 100 個真實程式碼庫任務,每個任務平均對應一個真實程式碼倉庫中長達233天、包含71次連續提交的演進歷史。簡單理解,SWE-CL 就是對是一場極為殘酷的“智能體耐力賽”!真實戰場: 選取的任務跨度平均達 233天,涵蓋 71次連續提交。模擬人類: AI不再是修完就跑,而是要像真正的開發者一樣,在 CI(持續整合) 的死循環裡,應對一輪又一輪的需求變更。殘酷規則: 這是一場總消耗超過 100億 Token 的極限耐力賽。這裡列出一些更詳細設定:每個SWE-CI任務都來自GitHub上68個真實Python倉庫(維護≥3年、≥500星、含單元測試和依賴配置檔案)。任務定義為:從“基線提交”(base commit)演化到“目標提交”(oracle commit),平均跨越233天、71次提交、至少500行原始碼變更(不含測試)。代理必須在 Docker 隔離環境中,通過最多20輪迭代,逐步完成需求變更。值得注意的是,雙Agent架構:架構師Agent:分析失敗測試、定位根因,輸出1-5條高層次增量需求文件。程式設計師Agent:遵循TDD(測試驅動開發)流程,實際修改程式碼。整個過程模擬真實CI/CD流水線,每一次變更都會影響後續狀態,前期決策的後果會逐步累積。這正是傳統基準無法模擬的“長期記憶”與“技術債務放大器”。因此,評估指標也從單一通過率升級為兩個核心維度:1、零回歸率(Zero-Regression Rate):在任務演化過程中,最初通過的測試在後續變更後仍保持通過的比例。2、lEvoScore:一種加權平均指標,公式為 EvoScore = Σ(i=1 to N) γ^i × a(ci) / Σ(i=1 to N) γ^i,其中γ>1對後期迭代賦予更高權重,強調長期穩定性。當γ=1時退化為普通平均歸一化變更得分。戰況慘烈:75% AI正在瘋狂製造“技術債”實驗結果讓所有人脊背發涼。即便是在2026年這樣一個 Vibe Coding 都顯得落伍的時間點,主流智能體的表現依然像個“只會打補丁的實習生”。第一,“零回歸率”之痛:在模擬真實開發的長期測試中,絕大多數大模型的“零回歸率”竟然不到 25%。這意味著它們每改四次程式碼,至少有三次會搞壞原本正常的功能。第二,程式碼庫雪崩: 隨著項目演進,大多數模型產生的技術債呈指數級增長。前期看似高效,後期改動一下,整個系統直接原地爆炸。那麼,這場耐力賽中,誰是最後贏家呢?如果你對程式設計Agent有關注,相信你已經猜到了,自然是 Claude 4.5/4.6。它是唯一能在長周期維護中保持 50%以上零回歸率的選手,展現出了極強的“架構師思維”。GLM-5: 作為國產大模型的代表,在應對長期程式碼演進時表現搶眼,穩居第一梯隊。驚喜發現:GLM、Kimi是救火隊長,DeepSeek、Minimax是架構大師值得注意的是,論文中還發現了智能體也存在明顯的“AI人格”現象。不同模型廠商之間的偏好差異顯著,而同一廠商旗下的程式設計智能體往往表現出一致的傾向。具體而言:“走一步看一步”型(Kimi, GLM): 這些模型在修改程式碼時更激進,追求立刻解決當下的 Bug 或需求,但在長遠看來,它們可能較快地耗盡了程式碼庫的演進空間。“長線規劃”型(GPT, DeepSeek, MiniMax): 這些模型在修改時可能更謹慎,會考慮到程式碼結構對未來的影響,更具有“架構師”潛質。“全能穩健”型(Claude, Doubao,Qwen): 無論你更看重眼前還是長遠,它們的表現都非常均衡。尤其是 Claude,結合之前的排名看,它是在保持穩定的同時,水平上限也最高的選手。具體怎麼做的呢?團隊通過調整參數 γ 的值,來觀察模型排名隨之產生的變化。當 γ<1 時,EvoScore 會給早期迭代分配更高的權重,這有利於那些優先考慮程式碼修改“即時收益”的模型。相反,當 γ>1 時,後期迭代會獲得更多獎勵,從而讓那些為“長期改進”而最佳化(即優先考慮程式碼可維護性)的模型佔據優勢。對於這個現象,研究人員推測,這反映了不同廠商在訓練策略上的差異;而各廠商內部模型的一致性則表明,其內部訓練流水線(Pipelines)在大體上保持了穩定。為什麼智能體如此容易積累技術債務?論文間接給出兩點原因:首先是短期最優決策:模型傾向於“最快通過當前測試”的方案,而非全域最優架構。上下文遺忘:即使多輪迭代,模型對早期變更的深層影響理解不足。其次,模型有依賴與邊界敏感性:真實倉庫的外部依賴、配置漂移、邊緣案例遠超訓練資料覆蓋範圍。這意味著:現實中,一家公司若大規模採用AI生成程式碼,初期交付速度可能翻倍,但6~12個月後維護成本可能指數級上升——bug修復、重構、遷移難度都會放大。未來方向:從“快修”到“可持續”這篇論文可以說用一場真實大規模實驗,驗證了一點:目前的絕大多數 AI Agent 都是“紙牌屋建築師”。它們追求當下的測試通過率,卻對程式碼的長期生命力一無所知。而 SWE-CI 的意義在於,它把 AI 程式設計的門檻從“跑得通”拉高到了“可維護”的實用層面。SWE-CI更多的意義在於提供“診斷工具”:企業可利用類似基準測試自家 AI 工作流,提前識別那些模型適合“長期駐紮”。他們給出了三個 SWE-CI 的最佳化方向:其一,提高γ權重可鼓勵模型追求長期穩定;其二,雙Agent架構可進一步最佳化(例如加入“回顧Agent”反思歷史決策);其三,與現有工具鏈結合(如自動生成維護文件、回歸測試優先順序排序)有望緩解問題。智能體有希望在耐力上獲得成功嗎?但研究者的本意,並不是祛魅智能體,“ SWE-CI 本身就是進步的催化劑”。他們認為,智能體在耐力上是有望突破的。首先,Claude 4.5/4.6的領先或許預示著,更強的推理能力(而非單純生成)是突破關鍵。其次,未來模型若能內建“架構意識”“債務評估模組”,或與靜態分析工具深度融合,維護能力或將迎來質變。項目已開源目前,SWE-CI 開源倉庫和 Hugging Face資料集都已上線,大家都可以自行復現、擴展。這意味著,2026年之後,AI編碼競賽的賽道將從“誰寫得快”轉向“誰寫得穩”。SWE-CI 開源地址:https://github.com/SKYLENAGE-AI/SWE-CIhttps://huggingface.co/datasets/skylenage/SWE-CI網友炸了:1000億美元,就是為了自動化技術債務?正如論文中所說:“Agent 的程式碼維護能力只有通過長期演化才能顯現,過去決策的後果會在連續變更中累積。”對此,不少網友表示無語了:AI Coding 的越快,積累債務的速度也就越快!X 評論區也有人諷刺:“AI自動化了遺留程式碼的生產線”、“我們花1000億美元算力,就是為了完美模擬一個‘快速出貨、8個月後棄坑的初級開發’”。HN 討論區甚至有人提問:“當 SWE-CI 成為新標竿後,AI 編碼工具的估值邏輯是否需要重寫?”所以,這麼看,程式設計師的飯碗總算保住了。但網友卻調侃:“現在安全了?但能撐10年?10個月?還是10天?”“寫程式碼 ≠ 維護系統。” 一位名為 Stephen Collins 的 Medium 作者表示:軟體工程從來不只是“寫程式碼”。它更關乎如何管理複雜性、演進系統架構,以及在成千上萬次變更中保持關鍵不變數的穩定。而 SWE-CI 這一基準表明,這些挑戰對當前的AI智能體來說依然是難點。這也意味著,下一代開發者工具的重心,很可能會從“生成程式碼”,轉向“理解系統”。而與此同時,真正高效的開發者,永遠是那些能夠清晰理解系統的人:知道那些部分最關鍵,風險集中在那裡,以及注意力該放在那。 (51CTO技術堆疊)
GitHub 上,人類已經幹不過 AI 了
今年,GitHub 上,AI 提交量佔比將達到 20%如果幾年前有人跟碼農同學說,「你以後可能要和 AI 搶 GitHub 提交記錄了」,他大概會笑掉大牙。但現在,他可能完全笑不出來了。根據 SemiAnalysis 最新發佈的分析報告,Anthropic 的 Claude Code,目前已經貢獻了 GitHub 上 4% 的公開提交量,並且有望在 2026 年底:達到 20% 的日提交量。這不是一個簡單的數位遊戲。當一個 AI 工具開始在全球最大的程式碼託管平台上「刷存在感」,它實際上正在重新定義什麼叫「寫程式碼」。01. AI「霸榜」GitHub4% 看起來並不是個很大的數字,但可怕的是這個數字背後的意義。GitHub 每天的提交量是一個天文數字。全球數千萬程式設計師在這個平台上推送程式碼、修復 bug、發佈新功能。而現在,每 25 次提交中,就有 1 次來自 AI。Anthropic Claude Code 負責人 Boris Cherny 在 X 上毫不避諱地「炫耀」:他的團隊現在 100% 使用 Claude Code 寫程式碼,連小的編輯都不再手動操作。更誇張的是,他們用一周半時間就用 Claude Code 建構了 Cowork 應用。這種效率提升不是線性的,而是指數級的。但真正讓人震撼的不是速度,而是質量。一位企業使用者透露,他 80% 的時間在使用 Claude Code,剩下 20% 用其他工具。「我的公司為 Claude Code 付費,我甚至不看成本。」這句話很有意思——當一個工具好用到讓人「不看成本」,說明它創造的價值,已經遠超價格。曾有業內人士曾這樣評價 AI Coding 的優勢:「AI 能繞過官僚主義。如果猶豫不決會讓大型組織陷入癱瘓,AI 不在乎。它會愉快地生成一個版本 1。」這句話點出了 AI 程式設計的核心優勢——沒有包袱,沒有猶豫,沒有「完美主義焦慮」。02. 程式設計師的「存在危機」但硬幣總有兩面。在 Hacker News 上,一位使用者分享了他的挫敗感:「多次我希望程式碼看起來是某種樣子,但它不斷拉回到它想要做事情的方式... 最終,我發現不與它爭鬥、讓它按照它想要的方式做事情更容易。」這段話透露出一個微妙的權力轉移:從「人指導 AI」到「人適應 AI」。Every 公司 CEO Dan Shipper 在部落格中寫道:「我們正處於自主程式設計的新時代。你可以在不看一行程式碼的情況下建構令人驚嘆的複雜應用程式。」聽起來很美好,但這也意味著傳統意義上的「程式設計師」,正在消失。如果你不需要看程式碼就能建構應用,那「會寫程式碼」,還算是一種核心技能嗎?SemiAnalysis 的分析師預測,這個趨勢將推動 Anthropic 在 2026 年實現爆發性增長,甚至超越 OpenAI。相比之下,GitHub Copilot 和 Office Copilot 雖然領先了一年,但「幾乎沒有作為產品取得任何進展」。這個對比很殘酷,也很說明問題:在 AI 時代,先發優勢可能不如產品體驗重要。03. 重新定義「程式設計師」但程式設計師同學可能不需要過分焦慮,程式設計師這個崗位不會消失,只是這個職業的定義在改變。就像 Dan Shipper 說的,即使在 2025 年,「你仍然需要真正理解底層架構,也許你仍然需要去查看程式碼」。但這個「需要」的含義已經不同了。程式設計師正在從「程式碼編寫者」變成「AI 協調者」。你需要知道如何與 AI 對話,如何審查它的輸出,如何在它犯錯時糾正它。你需要理解系統架構,但不一定需要親自實現每一行程式碼。一位 Google 工程師的反思很有代表性:社區對 AI 程式設計能力的討論「緊張」,一方面驚嘆於能力的提升,另一方面擔心被替代。但他強調,領域專業知識仍然重要,原型和生產環境之間的差距仍然存在。當 AI 程式設計足夠便宜、足夠好用,整個軟體開發的經濟學都會改變。也許 20% 的 GitHub 提交量只是開始。也許幾年後,我們會看到 50%、80%,甚至更高的比例來自 AI。這未必意味末日,而是一個新開始。真正的程式設計師不會被 AI 替代,而會學會如何讓 AI 成為最強大的工具。就像計算器沒有讓數學家失業一樣,AI 也不會讓程式設計師失業——它只會讓那些拒絕進化的人失業。程式碼即是機器語言,是 AI 的母語,將機器語言交還給機器本身,人類用自然語言描述 Idea,看起來似乎是個更自然的結果。 (極客公園)
再見,程式設計師!馬斯克預言2026年AI改變世界,進入奇點之年!
不用多說,相信每個人的時間線全被Claude Code刷屏了。馬斯克甚至斷言,「我們已進入奇點!2026年就是奇點之年」。這幾天,Claude Code在全網掀起的陣仗可真不小。一睜眼,地球首富馬斯克重磅宣告:我們已進入奇點!起因竟是,Midjourney創始人公開稱,聖誕假期自己敲的程式碼,比過去十年加起來還要多,簡直太瘋狂。「雖然能感到侷限,但我知道一切都不再一樣了」。同一天,馬斯克不止一次,直接宣稱「2026年就是奇點之年」。這個點評同樣是對Claude Code的高度讚揚。如今,包括Anthropic之父、前DeepMind/OpenAI研究員、Google首席工程師等大佬在內,都為其感到震驚。馬斯克:2026,奇點降臨一直以來,奇點這一概念就像科幻詞一般的存在。雷·庫茲維爾曾在2005年《奇點臨近》一書中,預測道技術奇點大約發生在2045年。而在最新出版的《奇點更近》著作中,他再次重申奇點時間:仍是2045年。誰曾想,這個看似還很遙遠的時刻,一下子被拉到了現在——2026年。所謂的技術奇點,是指技術在長期內增長緩慢,但在某個臨界點急劇加速,呈指數式上升。能夠讓馬斯克有這麼深感觸,竟是Claude Code席捲全網的強大程式設計能力。一點也不誇張地說,2026年開年這局,身邊的人都瞬間成為了Claude Code使用者。生物醫學工程師Derya Unutmaz雖不是專業程式設計師,升級訂閱就是為了更頻繁使用Claude Code。就連xAI聯創Igor Babuschkin感慨道,「有些年頭風平浪靜,啥大事沒有,可有些星期卻濃縮了數十年的變遷」。一夜之間,Claude Code為何變得這麼強了?真正的「民間高手」:Claude Opus精準來說,不是它變強了,而是一直就很強。去年11月底,超大杯Claude Opus 4.5一出世,Anthropic便宣稱其是全球最頂尖的編碼模型。內部測試中,Opus 4.5+Claude Code聯動使用,平均效率暴增220%。當時,Anthropic工程師預言,也許就在2026年上半年,軟體工程就被終結了。如今看來,可能就在最近了。剛剛,在最新升級的LiveBench榜單上,Claude Opus 4.5登頂,直接碾壓GPT-5.1 Codex MAX、Gemini 3 Pro。創始人Bindu Reddy稱,在聖誕假期期間,團隊改進了LiveBench,為了防止AI刷分作弊。這個排名在很大程度上,反映了這些LLMs在現實世界中的表現。去年12月,METR的一份報告揭秘了,全球最能打的AI還是Claude Opus 4.5。它在自主編碼任務中,能夠連續5小時不崩,也是迄今為止公開的AI完成長程任務時間最長的模型。AI大佬Simon Willison表示,Opus 4.5和GPT-5.2就像是一個轉折點。「模型逐步跨越到了一個隱形能力界限的時刻,忽然間,大量的編碼難題都被解決了」。即便是程式設計0經驗的人,也能在不到十分鐘的時間,打造出一款功能齊全的網頁應用。就像網友所言,如果不出意外的話,Claude Code可能會讓更多人成為百萬富翁。人類的最後一次發明如果我們翻開哲學家戴維·查爾默斯(David J. Chalmers)那篇經典的《奇點:哲學分析》,會發現當下的瘋狂景象,不過是這套嚴密邏輯推演的必然兌現。論文地址:https://consc.net/papers/singularity.pdf在查爾默斯的推導模型中,我們正處於一個被稱為「擴展前提(Extension Premise)」的關鍵節點。他將這一過程量化為從AI到AI+再到AI++的階躍:AI:人類水平的人工智慧。AI+:超越人類最強大腦的智能。AI++:超級智能,其超越程度正如人類超越老鼠一般。正如查爾默斯引用的I.J. Good在1965年的那個著名論斷:「超智慧型手機器(Ultraintelligent Machine)將是人類需要製造的最後發明」。邏輯非常性感且冷酷:機器設計機器:既然設計機器本身是一種智力活動,那麼一台超越人類的機器(AI+),必然能設計出比人類所能設計的更好的機器。遞迴的雪崩:這台被AI+設計出的新機器,擁有更強的設計能力,它將設計出下一代更強的機器。無限逼近:只要這台機器能通過編寫程式碼來最佳化自身,我們將無可避免地迎來一場「智能爆炸」。我們現在看到的,正是查爾默斯所描述的「速度爆炸」與「智能爆炸」的完美合流。當模型開始比人類更擅長最佳化演算法時,我們就不再是處於一個線性的增長曲線上,而是站在了垂直牆面的底端。每個人都會成為軟體工程師奇點來臨的那一刻,世界會有什麼不同?Google工程師Vaibhav Agarwal稱,自己再也不用寫程式碼了,現在70%-80%程式碼都是AI寫的。而他的工作僅是「程式碼審查」,角色發生了根本性的轉變,具體是這麼做的:• 不再輸入語法,用提示詞(Prompt)來定義邏輯;• 不再費力找 bug,而是審查AI給出的修改建議;• 不再硬啃遺留程式碼,直接讓AI把它講明白。許多工程師對此感到內疚,覺得自己像是在「作弊」。實際上並不是,他們是在進化。Agarwal曾問過一位資深領導,關於一個所有人都害怕的問題:AI會取代我們嗎?他是這麼說的——AI是一個效率倍增器,而不是替代品。如果你過去每周完成1倍的工作量,現在預期則是,同一周內完成4倍的工作量。沒有任何一家公司希望倒退。如今,衡量「生產力」的標準已經被整體抬高了。如果你因為自稱是個「純粹主義者」而拒絕使用 AI,那並不高尚——你只是慢了。AI不會取代你。但一個借助AI、能完成4倍工作量的工程師……滿足網友的好奇,工程師用的是自家的GeminiHyperbolic創始人Yuchen Jin直言不諱,要是在讀博期間有這些強大工具助力,自己不用耗費5.5年,可能一年就畢業了。此前,奧特曼在採訪中還曾表示,「用不了多久,每個人都會成為軟體工程師」。他隨口拋出了一個關於未來工作方式和軟體世界的超級觀點,但很多人還沒意識到這件事有多重要。核心想法其實很簡單,自然語言,就是新的程式設計語法。程式設計師大軍終結,不需要龐大的開發團隊才能做出第一個版本。只需描述出需求,AI直接把它做出來。在複雜系統中,AI智能體會直接「住」在程式碼庫裡。它們會自己瀏覽repo、修復bug、補測試、重構程式碼,並自動提交修改。一旦軟體開發被自動化,同樣的邏輯也會蔓延到營運、規劃,甚至部分管理工作。程式碼,只是倒下的第一塊多米諾骨牌。如果這一切真的發生,「學會寫程式碼」本身就沒那麼重要了。 (王晶華說AI)
再見,程式設計師!馬斯克宣判:奇點就在2026
不用多說,相信每個人的時間線全被Claude Code刷屏了。馬斯克甚至斷言,「我們已進入奇點!2026年就是奇點之年」。這幾天,Claude Code在全網掀起的陣仗可真不小。一睜眼,地球首富馬斯克重磅宣告:我們已進入奇點!起因竟是,Midjourney創始人公開稱,聖誕假期自己敲的程式碼,比過去十年加起來還要多,簡直太瘋狂。「雖然能感到侷限,但我知道一切都不再一樣了」。同一天,馬斯克不止一次,直接宣稱「2026年就是奇點之年」。這個點評同樣是對Claude Code的高度讚揚。如今,包括Anthropic之父、前DeepMind/OpenAI研究員、Google首席工程師等大佬在內,都為其感到震驚。馬斯克:2026,奇點降臨一直以來,奇點這一概念就像科幻詞一般的存在。雷·庫茲維爾曾在2005年《奇點臨近》一書中,預測道技術奇點大約發生在2045年。而在最新出版的《奇點更近》著作中,他再次重申奇點時間:仍是2045年。誰曾想,這個看似還很遙遠的時刻,一下子被拉到了現在——2026年。所謂的技術奇點,是指技術在長期內增長緩慢,但在某個臨界點急劇加速,呈指數式上升。能夠讓馬斯克有這麼深感觸,竟是Claude Code席捲全網的強大程式設計能力。一點也不誇張地說,2026年開年這局,身邊的人都瞬間成為了Claude Code使用者。生物醫學工程師Derya Unutmaz雖不是專業程式設計師,升級訂閱就是為了更頻繁使用Claude Code。就連xAI聯創Igor Babuschkin感慨道,「有些年頭風平浪靜,啥大事沒有,可有些星期卻濃縮了數十年的變遷」。一夜之間,Claude Code為何變得這麼強了?真正的「民間高手」:Claude Opus精準來說,不是它變強了,而是一直就很強。去年11月底,超大杯Claude Opus 4.5一出世,Anthropic便宣稱其是全球最頂尖的編碼模型。內部測試中,Opus 4.5+Claude Code聯動使用,平均效率暴增220%。當時,Anthropic工程師預言,也許就在2026年上半年,軟體工程就被終結了。如今看來,可能就在最近了。剛剛,在最新升級的LiveBench榜單上,Claude Opus 4.5登頂,直接碾壓GPT-5.1 Codex MAX、Gemini 3 Pro。創始人Bindu Reddy稱,在聖誕假期期間,團隊改進了LiveBench,為了防止AI刷分作弊。這個排名在很大程度上,反映了這些LLMs在現實世界中的表現。去年12月,METR的一份報告揭秘了,全球最能打的AI還是Claude Opus 4.5。它在自主編碼任務中,能夠連續5小時不崩,也是迄今為止公開的AI完成長程任務時間最長的模型。AI大佬Simon Willison表示,Opus 4.5和GPT-5.2就像是一個轉折點。「模型逐步跨越到了一個隱形能力界限的時刻,忽然間,大量的編碼難題都被解決了」。即便是程式設計0經驗的人,也能在不到十分鐘的時間,打造出一款功能齊全的網頁應用。就像網友所言,如果不出意外的話,Claude Code可能會讓更多人成為百萬富翁。人類的最後一次發明如果我們翻開哲學家戴維·查爾默斯(David J. Chalmers)那篇經典的《奇點:哲學分析》,會發現當下的瘋狂景象,不過是這套嚴密邏輯推演的必然兌現。論文地址:https://consc.net/papers/singularity.pdf在查爾默斯的推導模型中,我們正處於一個被稱為「擴展前提(Extension Premise)」的關鍵節點。他將這一過程量化為從AI到AI+再到AI++的階躍:AI:人類水平的人工智慧。AI+:超越人類最強大腦的智能。AI++:超級智能,其超越程度正如人類超越老鼠一般。正如查爾默斯引用的I.J. Good在1965年的那個著名論斷:「超智慧型手機器(Ultraintelligent Machine)將是人類需要製造的最後發明」。邏輯非常性感且冷酷:機器設計機器:既然設計機器本身是一種智力活動,那麼一台超越人類的機器(AI+),必然能設計出比人類所能設計的更好的機器。遞迴的雪崩:這台被AI+設計出的新機器,擁有更強的設計能力,它將設計出下一代更強的機器。無限逼近:只要這台機器能通過編寫程式碼來最佳化自身,我們將無可避免地迎來一場「智能爆炸」。我們現在看到的,正是查爾默斯所描述的「速度爆炸」與「智能爆炸」的完美合流。當模型開始比人類更擅長最佳化演算法時,我們就不再是處於一個線性的增長曲線上,而是站在了垂直牆面的底端。每個人都會成為軟體工程師奇點來臨的那一刻,世界會有什麼不同?Google工程師Vaibhav Agarwal稱,自己再也不用寫程式碼了,現在70%-80%程式碼都是AI寫的。而他的工作僅是「程式碼審查」,角色發生了根本性的轉變,具體是這麼做的:不再輸入語法,用提示詞(Prompt)來定義邏輯;不再費力找 bug,而是審查AI給出的修改建議;不再硬啃遺留程式碼,直接讓AI把它講明白。許多工程師對此感到內疚,覺得自己像是在「作弊」。實際上並不是,他們是在進化。Agarwal曾問過一位資深領導,關於一個所有人都害怕的問題:AI會取代我們嗎?他是這麼說的——AI是一個效率倍增器,而不是替代品。如果你過去每周完成1倍的工作量,現在預期則是,同一周內完成4倍的工作量。沒有任何一家公司希望倒退。如今,衡量「生產力」的標準已經被整體抬高了。如果你因為自稱是個「純粹主義者」而拒絕使用 AI,那並不高尚——你只是慢了。AI不會取代你。但一個借助AI、能完成4倍工作量的工程師……滿足網友的好奇,工程師用的是自家的GeminiHyperbolic創始人Yuchen Jin直言不諱,要是在讀博期間有這些強大工具助力,自己不用耗費5.5年,可能一年就畢業了。此前,奧特曼在採訪中還曾表示,「用不了多久,每個人都會成為軟體工程師」。他隨口拋出了一個關於未來工作方式和軟體世界的超級觀點,但很多人還沒意識到這件事有多重要。核心想法其實很簡單,自然語言,就是新的程式設計語法。程式設計師大軍終結,不需要龐大的開發團隊才能做出第一個版本。只需描述出需求,AI直接把它做出來。在複雜系統中,AI智能體會直接「住」在程式碼庫裡。它們會自己瀏覽repo、修復bug、補測試、重構程式碼,並自動提交修改。一旦軟體開發被自動化,同樣的邏輯也會蔓延到營運、規劃,甚至部分管理工作。程式碼,只是倒下的第一塊多米諾骨牌。如果這一切真的發生,「學會寫程式碼」本身就沒那麼重要了。 (新智元)