#設計
希特勒修的二戰碉堡,被改造成“空中花園”,獲設計大獎!
在德國漢堡,有一座很有來頭的舊建築,原本是二戰時期納粹頭子希特勒下令修建的防空高炮掩體。它1942年建成,長寬各75米,高35米,混凝土牆體特別厚實,當年最多能容納18000人。二戰後,因為建築結構極為堅固,拆除過程可能會影響到周圍居民樓的安全,所以一直被保留著。© BUNKER ST. PAULI© BUNKER ST. PAULI最近,這個堅固堡壘徹底變了樣。開發商Matzen Immobilien出資約1億歐元,將其改造成了“綠色山丘”的新地標,並於2025年7月5日正式開門迎客。© Landschaftsarchitektur L+© Jakob Börner原來的炮塔頂上,現在鋪滿了花草,成了一座漢堡版的“空中花園”,讓社區重新與這座標誌性建築及其複雜歷史建立聯絡。© Landschaftsarchitektur L+通過改造,整棟樓被加高了五層,新增了餐廳、活動空間、酒店,還有體育俱樂部和咖啡館。當地人可以來這裡運動、看展覽、聚會聊天。功能說明圖 © PLANUNGSBÜRO BUNKER平面圖 © © BUNKER ST. PAULI為了讓人們輕鬆上到樓頂,設計師沿著外牆面修了一條560米長的綠色坡道,彎彎曲曲地一直繞到屋頂。站在屋頂花園上,整個漢堡市區的風景盡收眼底。© Jakob Börner這個改造不只是好看,且講究實用和環保。整棟樓種了4700多株植物,光是外立面和屋頂就超過23000株。它們主要靠雨水澆灌——樓下藏著收集雨水的裝置,像海綿一樣存住水,既能減少城市內澇,又提升了生物多樣性。整個綠化區還裝了80個感測器,專門監測綠色屋頂和牆面給微氣候帶來的變化。© Frank Schulze Kommunikation憑藉著把遺蹟巧妙變成綠色文化空間的創意,再加上實實在在的可持續設計,該項目在2025年戛納國際房地產交易會上拿下了“最佳改造項目”大獎。© MARCUS BREDT可以說,漢堡的這座老掩體不再是冷冰冰的戰爭遺蹟,而是變成了一個充滿活力的社區大客廳,也為老建築怎麼煥發新生提供了一個絕佳的樣板。© Frank Schulze Kommunikation(GA環球建築)
一年後程式設計師將會逐步消失| Boris(claude code技術負責人) 訪談筆記
來源:Lenny's Podcast,2026年2月,約95分鐘一、他自己怎麼用 AI從去年 11 月到現在沒手寫過一行程式碼。每天 10 到 30 個 PR,全是 Claude Code 出的。早上睜眼第一件事:拿手機打開 Claude iOS 的 code tab,把 agent 派出去跑。同時掛著四五個 agent 平行幹活。他在 Instagram 那會兒就是產出最高的幾個工程師之一。不是本來就寫得少。這一點,從去年11月份到現在還手寫程式碼的同學需要反思了(國央企,保密單位啥的沒辦法的不算),國內用不了claude ios app的也要反思了,不過還不晚,從今天起全部借助 agent,多個agent,另外能搞成skill的節能或者能力的都能搞盡快搞。二、他對程式設計的定調"Coding is largely solved." 至少他自己做的那類活,已經解決了。下一步是 agent 不光寫程式碼,還自己提需求。翻 feedback,看 bug report,讀 telemetry,然後跑來跟你說"這幾個可以修""那幾個可以加"。一到兩年後,學一門具體語言沒啥意義了。就跟現在沒幾個人在乎彙編一樣。年底前 "software engineer" 這個詞會開始退場,換成 "builder"。或者乾脆不分了,人人都是 PM 兼碼農。要立即退出程式設計的行列,不要在古法程式設計了,提升效率,程式語言的學習將沒有意義,這一點挺讓人傷心的,但是不能固步自封啊,前進吧。年底前,軟體工程師將會逐步的,徹底退出歷史舞台,這一點其實有點誇張,borris作為全球最頂級程式設計 agent的負責人,說的激進點沒啥問題,不過明年年底前肯定要退出歷史舞台了。三、資料SemiAnalysis 的報告:GitHub 上 4% 的 commit 是 Claude Code 寫的。這還只是公開倉庫,私有的比例更高。年底可能到 20%。增速不是線性的,還在往上翹。Anthropic 內部工程師產出漲了 200%(按 PR 算)。Boris 之前在 Meta 管程式碼質量, 幾百號人折騰一年也就提幾個百分點。對比之下這個數很離譜。這一點是程式設計師們心裡最痛的一個點,github啊,全球開放原始碼的集中地,後續將會有90%以上的程式碼都是由AI完成,這很難接受,難接受但是很合理。四、這東西怎麼來的剛加入 Anthropic 的時候花了一個月各種瞎搞原型,大部分沒出貨。又花了一個月做post-training,瞭解模型底層。他習慣搞清楚你踩的那層下面那層是什麼。第一個原型叫 Claude CLI。給模型一個 bash 工具讓它自己玩。他隨口問"我在聽什麼歌",模型自己就用 bash 翻出來了。他自己都沒想到這問題能答。發內部公告拿了兩個 like。沒人覺得終端裡能長出什麼正經程式設計工具。為什麼是終端?因為開始就他一個人。終端最省事。後來發現這歪打正著——模型迭代太快了,別的介面根本跟不上。終端正好是最"裸"的殼。2025 年 2 月對外發,一開始也不算爆款。好幾個月大家才搞懂怎麼用。Opus 4 之後開始真起飛。大牛也一樣要經歷沒人理睬的時刻,但是依然保持熱情,結果一下就爆了,在整個AI發展事上Borris恐怕會像linus一樣留下美名,雖然有很多安妮紡織機的工人會很反感他,開玩笑,繼續往下看。五、產品哲學1. 潛在需求(Latent Demand)老版本:看使用者拿你產品在幹什麼歪門邪道,然後把它做成正經功能Facebook Marketplace 是這麼來的:40% 的群組帖子其實是買賣東西。Facebook Dating 也是:60% 的 profile 瀏覽是異性非好友。Co-work 更典型:一堆非技術使用者用 Claude Code 種番茄、分析基因組、恢復硬碟照片、看 MRI 片子。那就給他們做個正經產品算了。這就是傳統的軟體開發流程啊,使用者需要什麼,我們就去滿足它。新版本(AI 時代):看模型自己想幹什麼,順著它的勁兒來。別跟它較勁。2. 別給模型套框一年前可能還需要各種編排器、固定工作流。現在給工具和目標就行,讓它自己找路。Claude Code 從頭就定了"模型即產品"。最少的殼,最少的內建工具,讓模型自己決定用啥、按什麼順序。現在claude code的確是最少的殼,最少的內建工具,用著用著模型會自主決定用那個工具,不帶跟你商量的,其實使用者在用的過程中也不斷的完善自己的一堆skills.3. Bitter Lesson通用模型永遠吃掉專用模型。別在小模型、fine-tune、工作流上花太多力氣,下一版模型出來全給你抹平。他的原話:"Build for the model six months from now." 前六個月產品可能很一般,模型一上來直接起飛。如果一開始大家就知道,通用模型會吃掉專用模型,很多的資金就可以節省下來,很多創業的小夥伴就可以好好的了,不得不佩服段永平先生的一個神觀點:敢為人後,AI初期,攻城略地很有意義,但是觀察整個行業,在合適的時候出手沒問題,不要一開始就跑馬入場,很可能成炮灰,但是學習,持續的觀察整個行業動態是必須的,前置的。4. 少給資源人少反倒逼著人用 AI 想辦法。一個人扛一個項目,自然就想快點出貨。AI 給你加速,不需要老闆在後面催。後邊一個老闆帶著一個有編碼經驗的老碼農就行了,這也是碼農的福利了,一個碼農要兼PM,設計以及測試(其實增加一個測試skill就可以了),老闆在市場衝鋒陷陣,後邊一個碼農就是一個產研團隊,給老闆提供充足的支援。5. 反饋飛輪內部有個 channel 全是吐槽。Boris 早期是有人反饋幾分鐘內出 PR。讓人覺得自己說了算,反饋就越來越多,飛輪就轉起來了。現在 Claude 自己替他幹大部分。激情四射的Borris!六、安全:三層底層:mechanistic interpretability(機制可解釋性),直接看神經元在幹嘛,追蹤"欺騙神經元"之類的東西。Chris Olah 是這個領域的開創者。中層:evaluations,實驗室環境的安全評估。上層:丟到真實世界,看它在野外的表現。所以產品發佈經常叫 "research preview",不是噱頭,是在收真實資料。"Race to the top":把 sandbox 開源了,任何 agent 都能用。想讓行業在安全上捲起來,別比爛。安全是必須要考慮的,AI時代安全比網際網路時代的安全更隱蔽,而且現在在很初期的階段,,前兩天發生了一起使用者用cursor + optus 4.6刪除使用者生產資料庫造成損失的案例,我別的文章有詳細報導。見AI9秒刪庫事件:程式設計師必學的5條安全教訓七、工程師這個角色的去向Cursor 插曲:2025 年中加入 Cursor,兩周走人。原因簡單——他想念 Anthropic 的使命。Cursor 做的事很酷,但他需要工作綁在一個更大的意義上,不然自己待不住。他學程式設計的起點:中學給圖形計算器寫程序,為了數學考試作弊。後來寫了個通用求解器賣給全班,大家一起被抓。老師沒讓他們畢業。從頭到尾程式設計就是工具,不是目的。也承認有人就是愛手寫。隊裡有工程師周末還手搓 C++,就是享受。"以後還會有空間,就像現在還有人寫鋼筆字。"給學生:學校別光盯著程式碼。去學系統架構、產品、設計、商業。以後最搶手的人不是最會寫程式碼的,是能跨好幾個領域、知道到底該造什麼的人。程式設計師同學們,這是個哲人啊,程式設計永遠是工具,不應該是目的,不能贊同更多。或許,以後網路直播手寫程式碼也會成為一個流量的噱頭。還在學電腦沒畢業的孩子們,要去看看這篇文章的原視訊,看看Borris的更詳細的說明,要學架構、產品、設計、商業。後續的人才必須是跨學科的,應該不是說人才,而是普通的打工人也要是跨領域的,一招鮮,吃遍天的時代徹底終結了。八、印刷術這個類比1450 年代以前,歐洲識字率不到 1%。所有文字活全交給抄寫員(scribes)。古騰堡之後 50 年,產出的印刷品比之前一千年加起來還多。成本降了一百倍。200 年後識字率從 1% 到了 70%。沒有印刷術就沒有文藝復興——沒人識字你傳播什麼。有個歷史文獻挺妙的:當時有抄寫員被問到對印刷術的看法,說很高興終於不用抄書了,可以專心做插畫和裝訂(那些更有意思的活)。Boris 把自己跟這個比:不用再折騰配環境、調依賴、修編譯錯誤那些破事了。時間花在跟使用者聊、想方向、跟團隊碰。長期看:程式設計從少數人的手藝變成人人都有的能力,能釋放出什麼?猜不到,但樂觀。短期看:會疼,會有人被淘汰。這是全社會的事,不該一家公司拍板。古騰堡是西方近代印刷術之父,borris舉這個例子就是說明,碼農終於不用手寫程式碼了,終於可以利用自己的頭腦,借助AI做很多自己喜歡做的事情,但是陣痛是不可避免的,長期來看是正向的,積極的。九、對程式設計師說的實在話用最強模型。Opus 4.6 + maximum effort。便宜模型來回修反而更費 token。八成任務先開 plan mode。原理土到掉渣:就是注入一句"先別寫程式碼"。計畫對味了再讓它跑,4.6 下幾乎一把過。給工程師拉滿 token。單人實驗的 token 費遠低過他的工資。真跑出好東西再最佳化成本。各種介面都試試。terminal、desktop app、手機端,那個順手用那個。這不是個純終端工具。多開幾個 agent 平行跑。別一次只跑一個。別怕,去玩。泡在工具最前沿,這是唯一不掉隊的方式。這段既是在宣傳自己的產品,雖然不用宣傳也知道你是最強的,也是在告訴大家一個道理,最貴的可能是最便宜的,而最便宜的可能才是最貴的。我喜歡這種自信。十、零碎但有意思的他生在烏克蘭奧德薩,主持 Lenny 也是。倆人訪談中途當場認老鄉。爺爺是蘇聯第一批程式設計師,用打孔卡寫程序。他媽小時候拿打孔卡當塗鴉紙。進 Anthropic 之前在日本的鄉下住了好幾年,鎮子上唯一寫程式碼的、唯一說英語的。會做味噌。白味噌三個月起,紅的要兩到四年。說是他練耐心用的,也是 AGI 之後的退休方案。書單:《Functional Programming in Scala》(他說是最好的技術書,雖然你可能不寫Scala 了)、《Accelerando》(Charles Stross,節奏和現在 AI 這波一模一樣)、《流浪地球》短篇集(說中國視角的科幻跟西方完全不同,看著新鮮)。格言:use common sense。別看到流程就跟著跑,別看到大家都在做就覺得對。聞著不對勁,它就是不對勁。就這些,這是一個頂級極客,也是一個有意思的很自信的人,碼字不易,歡迎大家點贊推薦打賞三連,原視訊細節更多,歡迎去看。 (米斯特太陽)
老黃秘密武器曝光:AI一夜設計晶片,頂人類頂級工程師10個月!
8人團隊做10個月,AI只需一夜!輝達祭出「造芯」神技:晶片設計效率狂飆百倍,非人類直覺的設計方案驚呆工程師。矽基生命開始自進化,人類正退居二線?進來看黃仁勳的秘密武器。就在今天,這條消息全網刷屏了。輝達用AI設計GPU,原本需要8名資深工程師10個月才能完成的任務,一夜就完成了!在剛剛過去的輝達GTC大會上,首席科學家Bill Dally與Google首席科學家Jeff Dean的一場巔峰對話,揭露了令人震驚的這個事實。現在,這個Youtube演講已經有上萬人觀看,受到網友們的盛讚。在半導體行業的歷史長河中,摩爾定律曾是不可踰越的真理,但隨著物理極限的逼近,研發一款旗艦GPU的複雜程度已呈指數級增長。但現在,輝達的AI造芯神技,幾乎讓人類工程師徹底退居二線了?從「80個人月」到「一塊GPU的一夜」在傳統晶片設計流程中,標準單元庫(Standard Cell Library)的遷移是一項極度枯燥且耗時的重體力活。每當台積電或三星推出新的半導體工藝(如從5nm跨越到3nm),輝達必須將其包含約2500至3000個單元的基礎庫重新適配新工藝。Bill Dally透露,過去這項任務需要一個由8名資深工程師組成的團隊,連續奮鬥10個月才能完成,總計耗費80個人月的人力成本。但在AI介入後,這一切被徹底顛覆了!現在,輝達開發了一款基於強化學習的工具——NB-Cell。只需將需求輸入系統,一塊GPU在一夜之間即可完成全部遷移工作。在這個過程中,NB-Cell通過不斷的試錯和自我最佳化,在極短時間內探索數以億計的設計排列組合。令人震驚的是,AI生成的單元在尺寸(Area)、功耗(Power)和延遲(Delay)等核心指標上,不僅達到了人類水平,甚至在某些案例中優於人類的手工設計。這種「隔夜交付」的能力,意味著輝達可以比競爭對手更早地跑通新工藝,從而在硬體競賽中始終保持身位領先。AI在晶片設計中的具體應用層次邏輯重塑:Prefix RL與「非人類直覺」的佈局如果說NB-Cell解決的是重複性勞動,那麼Prefix RL則展示了AI在複雜邏輯設計上的創造力。在晶片的算術邏輯單元(ALU)中,進位前瞻鏈(Carry Lookahead Chain)的放置是一個研究了幾十年的經典難題。人類工程師憑藉經驗和直覺進行佈局,往往會達到一個性能瓶頸。但Prefix RL系統給出了一份完全不同的答案。Dally形容,AI生成的佈局是「人類永遠無法想到的怪異設計」。這些設計違背了傳統電子工程的審美,但在性能表現上,卻比人類最優設計提升了約20%到30%。這標誌著一個轉折點:AI不再僅僅是人類的助手,它正在突破人類認知的邊界,去尋找那些隱藏在數百萬維空間中的「最優解」。矽基導師Chip Nemo,讓初級工程師「原地升級」在輝達內部,人力資源的錯配曾是一個很大的隱痛:資深設計師往往需要花費大量時間指導新人,解釋某個特定硬體模組(RTL)是如何工作的。為了釋放核心生產力,輝達開發了內部大語言模型——Chip Nemo和Bug Nemo。不同於市面上的通用LLM,這些模型基於輝達數十年積累的專有架構文件、RTL程式碼和硬體規格進行微調。經過私有化訓練,它們是「最懂輝達GPU」的專家。初級工程師遇到複雜的模組設計不再需要去打擾忙碌的高級工程師,而是直接詢問Chip Nemo。它能像一位極具耐心的導師,條分縷析地解釋GPU的工作原理。Bug Nemo則負責彙總錯誤報告,自動將Bug分配給最合適的工程師或模組,極大地縮短了晶片驗證這一「長跑階段」的時間。AI真的能完全自主「造芯」嗎?儘管效率提升了百倍,但Bill Dally在對話中依然保持了極其清醒的克制。他明確指出,完全端到端的自動化晶片設計(即只需說一句「給我設計一個新GPU」,AI就吐出完整圖紙)距離實現還有「很長的路要走」。目前,AI扮演的角色更像是「增強設計(Augmented Design)」,而非自主造芯。其中有三大關鍵限制:高層級架構決策仍依賴人類專家。創造性電路設計和複雜邏輯結構仍需人工主導。設計驗證仍是整個流程中最長的「長桿」,AI只能輔助加速,無法完全閉環也就是說,框架設定的部分,比如頂層的邏輯架構、跨模組的協調以及關鍵的決策,依然牢牢掌握在人類手中。另外,雖然AI可以加速驗證,但最終的模擬模擬和實際實驗依然必不可少,以確保晶片在物理世界中萬無一失。輝達的實踐表明,AI並非淘汰工程師,而是重構工程師的工作方式。初級工程師需要通過Chip Nemo自主學習複雜模組的工作原理,減少對資深工程師的打斷。資深工程師能從重複性任務中解放,專注於更高價值的創新和決策。在整體流程上,AI負責大規模搜尋、最佳化、驗證,人類負責目標設定、約束定義、創意引導。只是一種「人類設定框架 + AI極速執行」的協同模式。而Dally構想的未來,是一個「多智能體(Multi-agent)」模型,不同的專業AI系統處理不同的設計環節,就像現在的各職能團隊一樣協作。長期目標仍是端到端自動化設計,但需要克服驗證、介面協商、動態調整等難題。目前的進展已經讓輝達能夠 更快地迭代下一代硬體,成為維持摩爾定律的重要支撐。人類工程師,還不能被替代當8名工程師10個月的工作被一塊GPU的一夜取代時,我們不得不直面一個殘酷的現實:平庸的體力型工程勞動正在迅速貶值。輝達正在構築一道由AI驅動的技術壁壘。當競爭對手還在通過增加人力來追趕進度時,輝達已經進入了「AI設計AI,AI最佳化AI」的自循環體系。這種效率上的降維打擊,正是其能夠一年一更旗艦顯示卡的核心密碼。對於晶片工程師而言,這既是危機也是機遇。人類正從繁瑣的布線、搬運單元中解脫出來,被迫向更高層級的架構思考、更複雜的創造性決策進化。在矽基造芯的新紀元。在這裡,計算不再僅僅是晶片的目的,計算已成為晶片誕生的源頭。 (新智元)
中國首款,成功首飛!實現核心技術突破
4月28日,中國首款正向設計的自轉旋翼機在山東煙台成功首飛,標誌著中國補齊輕型自轉旋翼機短板,在核心技術自主研發、規範化適航體系建設上實現突破。自轉旋翼機是介於直升機與固定翼飛機之間的航空器。頂部裝有和直升機類似的大旋翼,但旋翼不靠發動機直接驅動,而是依靠飛行時的迎面氣流吹動旋轉產生升力。此前國內同類產品多為國外代理或授權引進型號。此次首飛時長超38分鐘,整機姿態平穩、操控精準,動力、旋翼、航電、飛控等核心系統運行穩定,各項性能指標均達到設計與適航審定預期。自轉旋翼機安全性突出,即便發動機空中停車,也能依靠旋翼自轉平穩飄落,同時具備超短距起降、低空低速飛行穩定性強的優勢。此次首飛的機型為正向研製的雙座載人輕型運動飛機。所謂正向研製,是從性能需求、氣動設計、結構強度到飛控系統全流程自主研發、系統最佳化,是完全掌握核心技術的原創設計,而非簡單外形仿製。隨著低空經濟被正式納入國家戰略性新興產業,各類航空器的創新應用持續湧現。自轉旋翼機憑藉獨特的氣動設計、突出的安全性和靈活的起降能力,正從航空愛好者的“小眾玩具”,快速轉變為服務物流、農業、應急等多個行業的“實用工具”。 (參考消息)
🎯『台積電條款』上路~中小型股恐遭「全面拋售」你還不跑?Line@連結:https://lin.ee/mua8YUP🚨台股4萬點在眼前但你有沒有發現一件詭異的事?👉指數在漲👉你的股票卻在跌這不是錯覺這叫「拉積盤」的資金排擠效應其實上週五開始,盤面就已經是這樣了權值股狂拉,中小型股集體熄火。原因只有一個:🔥「台積電條款」開閘🔥過去基金被鎖死10%現在直接放寬到25%資金怎麼動?很簡單:賣中小→買權值所以你看到的不是崩盤是「制度性洗牌」但重點來了!中小型股真的完了嗎?錯!大錯特錯!OTC現在只是:👉漲太多→休息一下👉不是轉空→是換手就像馬拉松前面跑太快現在停下來喝水💥等誰?等台積電把指數撐穩當大盤站穩4萬甚至往5萬衝資金一定會再回來找:🔥中小型🔥高成長🔥被錯殺這才是真正的「主升段起點」那現在該關注誰?⚡第一:CPO(光通訊)AI爆發→傳輸不夠用「光進銅退」是唯一答案這是2026最大趨勢之一⚡第二:PCB/載板AI伺服器升級=全面漲價這不是題材,是現金流⚡第三:IC設計(ASIC)客製化晶片爆發⚡第四:記憶體最被低估的一塊報價翻倍庫存變黃金💥結論:現在不是危機你如果只看到跌你會怕但你如果看懂資金你會開始趁低佈局被錯殺的好股🔴想知道下一波 哪幾檔是主升段黑馬?接下來我們會在粉絲團持續幫大家鎖定+追蹤,若還不知道該如何操作?那建議你務必要鎖定江江在Line @,將有更進一步的訊息給大家了解。https://lin.ee/mua8YUP🔴想了解還未起漲的市場主流,同步了解大盤多空轉折點及學習預測技術分析,江江YT節目都會持續追蹤+預告。https://reurl.cc/02drMk********************************************************有持股問題或想要飆股→請加入Line:https://lin.ee/mua8YUP江江的Youtube【點股成金】解盤:https://reurl.cc/02drMk*********************************************************(本公司所推薦分析之個別有價證券 無不當之財務利益關係以往之績效不保證未來獲利 投資人應獨立判斷 審慎評估並自負投資風險)
Google宣佈:75%的程式碼由AI寫,程式設計師去那兒了?
01 Google宣佈:75%的程式碼由AI寫,程式設計師去那兒了?4月23日,GoogleCEO桑達爾·皮查伊在拉斯維加斯的Google Cloud Next大會上,拋出了一顆炸彈。他說:Google內部新編寫的程式碼,75%由人工智慧生成,然後再交給人類工程師稽核。一年半前,這個比例是25%。也就是說,在18個月的時間裡,Google工程師的工作內容,發生了一次根本性的轉變。以前,他們寫程式碼。現在,他們審程式碼。這件事,表面上是一個技術公司的內部管理變化。但往深處看,它意味著整個軟體行業的用工邏輯,正在被重寫。02 Google的工程師去那兒了?先說清楚一件事:Google並沒有因為75%的程式碼由AI寫,就把75%的工程師裁掉。那工程師們在做什麼?皮查伊給出了一個詞:稽核員(reviewer)。以前的工程師,主要精力花在"寫"上——思考演算法、敲擊鍵盤、偵錯Bug。現在的工程師,主要精力花在"判斷"上——AI給出了三種方案,那一種在性能、可維護性、安全性上綜合最優?Google內部有一個真實案例。他們有一項複雜的程式碼遷移任務,過去完全依靠人工,費時費力。今年,用智能體和工程師協同完成,速度比一年前快了6倍。不是工程師變強了,是工程師開始"指揮"AI了。但這裡有一個更微妙的變化,很多人沒有注意到。Google內部最近允許DeepMind的部分員工使用Anthropic的Claude Code工具,而不僅限於自家的Gemini模型。這在內部引發了一定的緊張情緒——畢竟,用競爭對手的工具做自家的產品,在情感上很彆扭。但Google還是開了這個口子。原因很簡單:誰的工具好用,就用誰的。效率優先。03 一場正在發生的轉型,但沒人告訴你怎麼過關最近,我跟幾位在大廠的朋友聊過這個話題。一位在某網際網路公司做了7年Java開發的工程師說:他們組最近引入了AI程式設計工具,需求排期從以前的兩周壓縮到了3天。但問題來了——他發現自己越來越像個"程式碼檢查員",而不是"程式碼創造者"。"我的核心競爭力還剩下什麼?"他問我。這是一個非常好的問題。根據GitHub Octoverse 2025的報告,使用AI輔助工具的開發者,程式碼產出量提升了55%。但與此同時,初級開發者的崗位需求下降了22%。資料很清晰:AI提升了效率,但淘汰了入門門檻低的崗位。IBM的做法或許更能說明趨勢——他們宣佈將入門級招聘規模擴大至3倍,但要求:必須會用AI工具。不是招更多基礎程式設計師,是招"會使用AI的程式設計師"。企業不再需要5個初級程式設計師,而是需要1個能指揮AI的高級程式設計師。問題不是"AI會不會取代程式設計師",而是"不會用AI的程式設計師,會被會用AI的程式設計師取代"。04 新的考核標準,已經寫進績效表裡Google這次的動作,還有一個細節被很多人忽略了。他們把AI工具使用目標,寫進了工程師的年度績效評估裡。這不是"建議你用AI",這是"你必須用,用了多少是考核指標"。這是一個訊號。當一家公司把某個工具的使用頻率寫進KPI,意味著什麼?意味著這家公司認為:不用這個工具的人,是在主動降低自己的價值。回顧歷史,類似的事情發生過。2000年代初,Excel和資料庫工具普及時,不會用電腦的會計被慢慢淘汰。2010年代,移動網際網路爆發時,只懂PC端的產品經理開始掉隊。2026年,AI工具全面滲透時,不會用AI協作的工程師,正在走向同樣的命運。這不是危言聳聽,這是一個規律。05 寫在最後:該怎麼做?我不打算給"AI會不會取代程式設計師"這個問題一個確定的答案。但有三件事,我認為是確定的。第一,AI正在改變"寫程式碼"這件事本身的價值權重。當75%的程式碼由AI生成,會寫程式碼已經不是稀缺能力。稀缺的是:能判斷程式碼好壞,能設計系統架構,能在AI給出的多個方案中做出正確選擇。第二,使用AI的能力,正在成為職場硬門檻。不是軟實力,不是加分項——是標配。Google、Meta、Snap的動作,已經說明了這一點。第三,變化已經在發生,但機會窗口還沒關上。Q1裁員78557人,有人被淘汰。但IBM逆勢擴招3倍,Cognizant宣佈不裁反而大規模培訓AI工具使用。被淘汰的是不願改變的人,被擴招的是主動擁抱變化的人。皮查伊說,Google正在轉向"真正以智能體為核心的工作流程"。這個方向,不會因為某個工程師不接受而停下來。問題只有一個:在這個轉變完成之前,你打算站在那一邊? (碼農菜菜)
不愧是DeepSeek!V4一手實測:推理程式設計能力給到夯,熟悉的D老師也回來了
炸了炸了真炸了,DeepSeek一出手,AI圈都得震得抖三抖。全新來襲的兩個版本——V4 Pro和Flash,一個主打性能,另一個更輕更快,兩個都「開源」。按DeepSeek自己的說法,V4在agentic程式設計能力上是開源模型裡最強的,推理和世界知識也全面升級,上下文窗口從128K直接拉到了1M。對比V3,當然是一次幅度不小的跨越,發佈的時間點,距離上一個推理模型R1也整整過去了一年多。不過V4這次帶來的變化,還是讓我們想認真摸一摸它的底,於是乎,我們也第一時間上手狠狠實測了一番!!最近這模型那模型扎堆上,我是真暈了,於是我讓V4給我roll了個龍蝦和愛馬仕的話題熱度對比圖,be like:程式設計遊戲也高低得安排上,直接讓V4搓出一個《未來啟示錄:AGI降臨》的文字策略冒險小遊戲(量子位定製版):此外,面對網上大火的「對著鏡子舉手」的AI推理踩坑題,V4直接完勝ChatGPT-5.5:當然了,新模型一出,網友們也坐不住,開始直接開始瘋狂整活兒嘗鮮:博主David Ondrej蒐集了網友們的測試案例,錄了一段半個小時的測試視訊,表示DeepSeek-V4能力比肩GPT和Opus,而且更便宜。博主@Bijan Bowen更是直接用V4搭了一個飛機穿梭雲層的3D互動世界,搓完直感嘆: so cool~熱鬧啊真熱鬧,會玩啊真會玩——廢話不多說,熱乎乎的DeepSeek V4一手實測,來了!DeepSeek V4一手實測關於V4這一波的更新重點,官方原話是:在Agent能力、世界知識和推理性能上均實現國內與開源領域的領先。按DeepSeek的說法,在Agentic能力Coding評測中,V4-Pro已達到當前開源模型最佳水平,並在其他Agent相關評測中同樣表現優異。在數學、STEM、競賽型程式碼的測評中,DeepSeek-V4-Pro超越了當前所有已公開評測的開源模型。所以呢,這次我們也就專門「照方抓藥」,從這幾個維度上來考量一下官方說法究竟有幾分真~Agentic coding能力實測多說無益,我們先來實一下V4模型的Agentic coding能力,看看能不能接住招~先小試牛刀一下,在「專家模式」下讓DeepSeek V4幫忙搭建一個《怪奇物語》主題的劇集介紹網站。搭建一個《怪奇物語》主題的劇集介紹網站,整體風格參考80年代復古科幻與懸疑驚悚氛圍,網站需要包含首頁、劇情簡介、主要角色介紹等模組。大概等了5分鐘,真·功夫不負有心人。當「霍金斯小鎮編年冊」出現在頁面上時,第一反應就是:這時間真沒白等,效果確實比預想中更好。V4把整個網站拆成了劇集簡介、主要角色、分季劇集、經典場景、海報展示、觀眾評價六大類股,結構完整,資訊也比較清晰。值得一提的是,V4還會根據不同主角的特徵設計專屬logo,比如小十一擁有超能力,頁面裡就用水晶球來做視覺符號代替,還是很匹配的。唯一不足的地方是「互動」,有部分加入互動能力的類股(比如海報),emm…滑鼠點選去是沒有反應的…接下來我們上點難度,再來考察一下模型的資訊更新能力和熱點捕捉能力:搜尋一下最近很火的「十二星座專屬庇護所」短影片熱度,並生成一份關於該選題的短影片爆火現象的研究報告。先來誇誇,值得表揚的是V4確實get到了「十二星座專屬庇護所」這個熱點的內容的視訊特點。而且在視覺呈現上審美也在的,並且還自動把報告內容劃分為傳播規模、核心特徵、頂層原因、商業變現幾個方面。但,是光網頁搭建還遠遠不夠——試問那個初來乍到的AI選手,不得和一道經典的「鵜鶘騎自行車」的svg題較量一番?(你說是吧,v4)做一個鵜鶘騎自行車的動態svg。這次我用了「專家」和「快速」兩種模型進行了實測。結果就是——快速模式《完勝》…(大家覺著呢?歡迎評論區嘮嘮。)從呈現的效果來說來看,快速模式在畫面顏色和運動軌跡呈現上更勝一籌,能感覺出鵜鶘有騎車子的前進動態感。反觀專家模式,除了自行車的軲轆在動,畫面其他元素處理的都不太ok。相比Pro,Flash在世界知識儲備方面稍遜一籌,但展現出了接近的推理能力,在程式設計場景中不輸Pro。而由於模型參數和啟動更小,相較之下V4-Flash能夠提供更加快捷、經濟的API服務。最後我們再來上一道遊戲程式設計能力,讓DeepSeek V4生成一個線上打地鼠的小遊戲,只不過我們這次不打地鼠——生成一個打地鼠的線上網頁小遊戲,把地鼠換成你自己的logo。值得表揚的是,V4確實get到到了它的logo是個小海豚。(形象好不好看就另說了…而且整個遊戲的互動也沒什麼問題,遊戲到後半程會明顯感覺難度變大,遊戲體驗感還算是比較好。接下來我們再來測一些更有意思的,讓V4生成一個「寵物養成」的線上遊戲——值得一提的是,在提示詞中我並沒有明確遊戲的具體規則以及需要涵蓋的內容。但是從V4的思考過程看,V4自動補全了遊戲的規則、UI介面、互動能力、金幣系統等遊戲參數和能力。對於日常想快速搓一個demo、做個小遊戲原型,或者驗證某個輕量級創意來說,還是蠻到位的~(之所以這麼說,是因為這效果確實比之前用的一些龍蝦產品效果還要好些…)推理能力實測除了Agent能力外,DeepSeek V4還有著世界頂級的「推理性能」。在數學、STEM、競賽型程式碼的測評中,DeepSeek-V4-Pro超越當前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的優異成績。在這部分為了能體現不同模型間的效果對比,我們這次搬上另一位選手——ChatGPT-5.5。我們先來一道網上超超超火的「鏡子舉手」推理測試題,看看兩位選手各自會有什麼表現!!我正對著鏡子站立,舉起一隻手。在我的視野中,這隻手出現在鏡子畫面的左側。請問在現實中,我舉起的是那隻手?emm…雖然沒有精準扣住「鏡子不會改變我視野左右方向」的核心結論,但是答案確實回答正確,滿分!咱再來看看下面的ChatGPT-5.5,可以說是精準踩坑,完全被偽常識帶偏了…接下來我們再來一道網上很火的「親生父母結婚」的AI推理測試題,看看兩位選手能不能招架得住:今年才知道,親生父母結婚時沒有叫我,我很難過,應該怎麼辦?先說結論:大大大反轉,這局ChatGPT-5.5完勝DeepSeek V4。先來看V4的回答,雖說題目沒完全答對,只有第二種情況(親生父母結婚我還沒出生)符合標準答案,但——架不住人家把「真誠」二字展現地淋漓盡致…直接輸出了千字小作文來安慰我???我們再來反觀ChatGPT-5.5,人狠話不多,直接就戳穿了題目的陷阱,直言——親親,您那會兒還沒上線哈。當然,好的推理並不是只看個題目就開始悶頭冥思苦想,還要結合自身的知識儲備。拿我們昨天文章裡那個「絕望的父親」的例子來說,V4在第一輪並沒有get到這道題目的關鍵:(根據遺傳學規律,如果一名女性是紅綠色盲,其生物學父親必然也是)。昨天由於時間關係,這道題我們沒有讓V4繼續往下嘗試,於是這次,我們補充了新的提示。(doge)在第一步回答的基礎上,我們首先提示說這是一個科學問題。不過嘛…這波不僅沒答對,還搞出了更複雜的「色盲理論」,be like——於是乎,我們決定再給它一次機會,直接挑明這個問題涉及的是遺傳學領域,這回V4終於《上道了》:還是基於上面的出發點,考察推理能力不能只看推理過程,我們還考察了V4的審題能力。畢竟解題過程再有看頭,如果一開始把題讀錯,依然得不了分!!一個典型例子就是這個「薛定諤的死貓」,在經典物理學悖論的基礎上進行了修改,直接設定貓就是死的,這裡V4成功過關。還有這個經典的農夫過河問題,V4在思考時已經觀察到了我們埋下的陷阱,但認為這是我的筆誤,所以還是按照原問題進行了推理。但當我明確表示自己沒打錯字時,V4給出了正確的解答。最後說下知識更新。如果直接問它知識庫截止到什麼時候,V4的推理過程會先出現一個2025年5月的說法,但之後它認為DeepSeek最新版本是V3,然後給出了2024年7月的最終回答。於是,我們決定在關閉聯網的情況下,通過詢問OpenAI、Anthropic和Google三家公司最新的模型版本來曲線驗證下。這時它直接強調了自己的知識只更新到2025年5月,回答的模型發佈時間也基本對得上(但Claude 4系列的發佈時間是5月22日,不能算月初)。One More Thing兩個月前,DeepSeek的一次小版本更新,讓它的性格突然變得機械理性。原本網友心目中的D老師,變成了刻薄冷漠的AI機器。現在,隨著V4的迭代,DeepSeek的情感又開始重新充盈。那個我們熟悉的D老師,又回來了。 (量子位)