#UI
Gemini 3 Pro 封神的背後:Google致敬的那個男人,竟然是個“快樂的無業游民”
最近,Google 的 Gemini 3 Pro 徹底刷爆了技術圈。它之所以能從眾多大模型中殺出重圍,不僅僅是因為它的推理能力更強了,而是因為它帶來了一個革命性的功能——“生成式 UI”(Generative UI)。當你對它說“做一個貪吃蛇遊戲”時,它不再是像以前那樣給你吐出一大段冰冷的程式碼塊,而是直接在螢幕右側“畫”出了一個可以玩的、互動流暢的遊戲介面。這種“忽略過程,直達結果”的產品哲學,讓無數開發者驚呼“變天了”。但 Google 為什麼會有這個想法?如果你把時間軸撥回 2025 年 2 月,你會發現這個理念其實源於一條推特。當時,Andrej Karpathy 發推提出了 "Vibe Coding" 的概念:“未來我們不需要寫程式碼了。我們只需要沉浸在一種感覺(Vibe)裡,甚至忘掉程式碼的存在。”Google 聽懂了。他們把 Karpathy 這種“看不見程式碼”的終極幻想,做成了 Gemini 3 Pro 的核心。那麼,這個讓兆巨頭都要“偷師”理念的男人,到底是誰?AI 界的“六邊形戰士”:Andrej KarpathyAndrej Karpathy 這個名字,對於普通人可能有點陌生,但在 AI 開發者心中,他是神一般的存在。回顧他的履歷,你幾乎可以看到整個現代 AI 發展的縮影:1. 名師高徒的學術起點在史丹佛大學攻讀博士期間,他是 AI 教母 李飛飛(Fei-Fei Li) 的得意門生。在那裡,他設計並主講了傳奇課程 CS231n,這門課至今仍是全球無數電腦視覺工程師的“入行聖經”。2. OpenAI 的創始元老博士畢業後,他成為了 OpenAI 最早期的核心研究員之一,與 Ilya Sutskever 等人一起奠定了 GPT 系列的基礎。3. Tesla 的自動駕駛統帥隨後,他被 Elon Musk 挖走,擔任 Tesla 的 AI 總監。在那裡,他直接向馬斯克匯報,領導了 Autopilot 團隊,不僅一手搭建了 Tesla 的資料飛輪,更主導了那個當時備受爭議的決策——放棄雷達,轉向純視覺方案。4. 回歸教育與再出發功成名就後,他沒有選擇躺在功勞簿上,而是離開大廠,回歸初心。他在 YouTube 上開設了 《Zero to Hero》 系列課程,手把手教普通人寫大模型。如今,他創辦了 Eureka Labs,致力於用 AI 重塑教育,試圖打造一種全新的“AI 原生”學習方式。學術界、工業界、教育界,他不僅都去過,而且在每一個領域都做到了頂尖。5 個故事,看懂“頂級極客”的另一面如果光看履歷,你可能會覺得他是一個高高在上的精英。但實際上,Karpathy 之所以如此受歡迎,是因為他極其真實、有趣,甚至有點“奇葩”。01:周末隨手寫個程式碼,羞辱了整個行業(llama2.c 事件)2023 年,大家都覺得跑大模型(LLM)非常複雜,需要安裝幾 GB 的 PyTorch 庫。 Karpathy 有個周末閒著沒事,覺得現在的 AI 軟體棧太臃腫了。於是他用純 C 語言(不依賴 Python,不依賴 PyTorch)寫了一個推理引擎。 這個檔案只有 500 行程式碼,編譯完的可執行檔案只有幾 MB,卻能在 MacBook 上流暢運行 Llama 2 模型。 他用一個周末的“玩具”,狠狠打臉了那些把 AI 搞得過於複雜的框架,也讓無數人第一次真正看懂了 LLM 是怎麼跑起來的。02:把自己當成“神經網路”來訓練(生物駭客)Karpathy 是典型的**“工程思維入腦”**。他不只最佳化程式碼,還瘋狂最佳化自己的身體。睡眠實驗: 他通過 Oura Ring 監測資料,調節溫度、濕度、光線,測試不同變數對“深度睡眠分數”的影響。他在推特上像發佈模型訓練日誌一樣,發佈自己的睡眠資料分析。咖啡演算法: 他曾詳細分享過自己的咖啡攝入策略——不是為了好喝,而是為了維持血液中咖啡因濃度的恆定,以保持大腦 GPU 的最佳算力。這完全是把生理機能當成 Learning Rate(學習率)在調節。03:在 Tesla 的“豪賭”(切斷雷達)當時所有自動駕駛公司都認為必須用雷射雷達(LiDAR)。但 Karpathy 和馬斯克認為:人類只靠眼睛就能開車,所以車也應該只靠攝影機。他領導團隊重寫了 Tesla 的感知棧,建構了著名的 HydraNet,並推動移除了車上的雷達。據說他在 Tesla 工作時,為了處理海量資料,經常就在辦公桌下鋪個睡袋睡覺(這點倒是和馬斯克很合拍)。04:史上最“不務正業”的無業游民離開 OpenAI 和 Tesla 這種頂級公司後,大家都以為他要去融資幾億美金開公司。結果他回家錄 YouTube 視訊去了。他拒絕了無數投資人的電話,只是為了把極其複雜的 Transformer 模型講得連高中生都能懂。他在推特上自嘲說自己是"Funemployed"(快樂的失業者)。這種“視金錢如糞土,只想教書育人”的態度,也是為什麼很多開發者對他有類似“聖徒”般崇拜的原因。05:痛恨“臃腫”的潔癖Karpathy 有嚴重的程式碼潔癖。他非常討厭複雜的抽象層。如果一個任務可以用 100 行原生程式碼解決,他絕不會引入一個 100MB 的第三方庫。雖然他現在推崇 Vibe Coding,但他本人的基本功極其紮實。他在 Stanford 教書時,曾強制要求學生手動計算反向傳播的梯度,不准用自動微分框架。他的邏輯是:“如果你不知道引擎蓋下面發生了什麼,你就沒資格開這輛法拉利。”AI 時代,“懶”是一種稀缺的超能力看完 Karpathy 的故事,再回看 Gemini 3 Pro 的“生成式 UI”,你會發現一個有趣的核心:這些頂級的創新,往往源於一種“懶”。Karpathy 因為“懶”得處理臃腫的環境,寫出了極簡的 llama2.c;因為“懶”得處理多餘的感測器資料,搞出了純視覺自動駕駛;因為“懶”得寫重複的程式碼,提出了 Vibe Coding,最終啟發了 Google 的生成式 UI。在 AI 時代,我們從小被教育的“勤奮”——死記硬背、機械重複、拼手速——正在迅速貶值。相反,“懶”正在成為一種核心競爭力。這裡的“懶”,不是躺平,而是一種敏銳的需求洞察力:是因為對低效流程的不耐煩,你才會去想如何最佳化它;是因為不想把時間浪費在重複造輪子上,你才會去尋找更高級的工具。Gemini 3 Pro 這樣的工具出現,正是為了成全我們的“懶”。它把我們從“如何實現”的苦役中解放出來,讓我們有精力去思考“實現什麼”和“為什麼實現”。所以,像 Andrej Karpathy 一樣,做一個“聰明的懶人”吧。在這個時代,發現需求比解決需求更重要,定義問題比動手執行更珍貴。 (許良學AI)
蘋果 WWDC25 終極前瞻:打不過 AI,我還打不過「UI」嗎?!
真正的「Apple 智能」到來之前,蘋果還想先把你手上的系統全更新一遍。台北時間 2025 年 6 月 10 日凌晨,WWDC25 的主題演講將準時開啟,蘋果過去一年的軟體研發成果將在此集中亮相。與往年可能聚焦單一突破性技術或硬體不同,今年的 WWDC25 似乎承載著更為宏大的敘事——一次深刻的生態系統「對齊」與視覺語言的「進化宣言」。大會那句頗具玩味的標語「Sleek peek」(時尚一瞥),以及邀請函視覺設計中那磨砂玻璃質感的蘋果 Logo,無不在強烈暗示:一場由設計語言革新主導,甚至可能堪比 iOS 7 時代那場著名「扁平化革命」的更新即將出現。WWDC2025 海報 | 圖片來源:Apple在經歷了 WWDC23 的顛覆性新品類(Vision Pro)和 WWDC24 的新軟體為核心(Apple 智能)之後,WWDC25 極有可能扮演一個「整合與對齊之年」的角色:換言之,就是通過將過去十餘年已經沒更新的系統 UI 部分給「補課」回來,從而通過這種方式來繼續引領作業系統的下一次革新。01 「26」更名與「Solarium」視覺更新雖然 WWDC2024 蘋果關於「Apple 智能」的宣傳,與一年後的今天實際交付給使用者的 AI 能力仍然有著不小的差距,造成了「翻車」,但回到作業系統這一戰場上,蘋果仍然是其中的佼佼者同時也是事實上的「行業最強」。坊間流傳最廣、也最引人遐想的,莫過於蘋果計畫對其作業系統命名體系進行一次大刀闊斧的改革。傳統的增量版本號(如 iOS 19、macOS 15)或將被基於年份的全新品牌標識所取代。在 WWDC25 上,我們極有可能見證 iOS 26、iPadOS 26、macOS 26(代號據傳為「Tahoe」)、watchOS 26、tvOS 26 乃至 visionOS 26 的集體登場。新系統,新命名 | 圖片來源:MacRumor這套「26」的命名方式,更像是汽車行業常用的車型年份策略,讓使用者更容易理解作業系統對應的是未來一年的更新,而對於 macOS 而言,除了數字代號,其以加州地標命名的悠久傳統預計仍將保留。據分析師 Mark Gurman 介紹,採用下一年的年份進行命名,能夠給外界塑造一種「擁抱未來」的品牌形象,這與大規模視覺革新的主題高度契合。其次,統一的命名體系,將極大降低使用者和開發者在蘋果日益豐富的產品線上理解版本相容性和當前狀態的認知門檻,有效解決了生態系統擴張帶來的一個痛點。除此之外,也有一部分分析師認為,此舉可能是蘋果用以轉移外界對其 AI 能力暫時落後關注點的一種策略,通過聚焦全新的、系統級的身份標識來主導輿論風向。這種變化甚至可能預示著蘋果內部正醞釀向更敏捷、更頻繁的功能推送模式轉變,而非固守單一的年度整體更新模式。與命名體系變革平行的,將是一場代號為「Solarium」、或被設計師 Sebastiaan de With 形象地稱為「Living Glass」的全平台視覺設計語言大革新。這被普遍認為是自 2013 年 iOS7 拋棄擬物化、轉向扁平化以來,蘋果最大規模的一次設計語言迭代。代號為「Solarium」可能是自 iOS 7 之後最大的視覺更新 | 圖片來源:ZDNet新的設計語言將深度借鑑 visionOS 的核心元素,例如更趨近圓形的「圓角矩形」圖示、廣泛應用的半透明毛玻璃效果的窗口元件、懸浮式的菜單與導覽列、富有層次感的層疊玻璃效果,以及在整體視覺上更強調深度感和物理質感。設計師 Sebastiaan de With 更是將「Living Glass」概念化為一種動態的、彷彿擁有生命的玻璃材質,UI 元素能夠反射內容、對光線變化作出細膩反應,甚至展現出類似液體表面張力的物理特性。這場視覺革新的核心目標,是統一蘋果旗下所有作業系統的設計語言,顯著減少使用者在 iPhone、iPad、Mac、Apple Watch 及 Apple TV 等不同裝置間切換時的視覺跳躍感和認知負荷,從而營造一個更渾然一體的生態系統體驗。這種被稱為「玻璃擬態」(glassmorphism)的設計,其意義遠不止於美學提升,同時可以巧妙地引導使用者逐步適應增強現實(AR)和混合現實(MR)的互動裸機。因為在這些新興場景中,透明度、深度感知和物理反饋是至關重要的介面元素。02 全家桶前瞻:你的蘋果裝置要變啥樣?iOS 26 與 iPadOS 26:移動與平板的「智能進化」與「專業進階」在目前已知的細節部分,iOS 26 中,「Solarium/Living Glass」設計風格將得到全面貫徹,帶來全新的圖示、菜單佈局,許多應用中可能會出現更現代的藥丸形狀底部導覽列。相機應用的介面據傳也將進行簡化,操作更直觀。新系統強調更直觀的操作反饋| 圖片來源:ZDNet除了 UI 更新,蘋果可能也終於會為搭載 USB-C 介面的 iPhone 開放連接外部顯示器的能力,實現類似桌面模式的操作體驗,提升特定場景下的生產力。而 iPadOS 26 將繼續在「專業化」的道路上邁進,力求讓 iPad Pro 更能勝任複雜工作流。傳聞中最引人注目的變化是,當配合妙控鍵盤使用時,iPadOS 26 可能會呈現出類似 macOS 的頂部菜單欄,進一步模糊平板與筆記型電腦的界限。macOS 的菜單欄設計預計將「下放」iPadOS|圖片來源:極客公園同時,台前調度(Stage Manager)功能有望升級至 2.0 版本,提供更強大的多工處理能力,或許在連接鍵盤時會自動啟動。更靈活的窗口管理機制,如可自由調整大小的應用窗口、懸浮窗口等,以及更佳的應用切換體驗和增強的外部顯示器支援,都是 iPadOS 26 提升生產力的關鍵方向。macOS 26 「Tahoe」:連續互通與視覺統一的深化macOS 26,據傳代號為「Tahoe」,其核心升級同樣圍繞「Solarium/Living Glass」的視覺統一展開,力求與 iOS 和 iPadOS 在觀感和互動上達到前所未有的一致。同一個團隊,同一套設計 | 圖片來源:Apple這當然也意味著全新的系統圖示、菜單樣式、更簡潔的設定介面以及模組化的控制中心元素。連續互通功能將進一步強化,例如在 macOS Sequoia 基礎上增強的 iPhone 鏡像功能,使得 Mac 與 iPhone、iPad 之間的協作更加天衣無縫。生產力工具方面,聚焦搜尋有望整合自然語言處理能力,讓搜尋更智能、更精準 ;快捷指令(Shortcuts)也將擴展其自動化能力。此外,有傳聞稱蘋果可能會為 Mac 平台引入一款全新的專用遊戲應用程式,提升 Mac 在遊戲娛樂方面的體驗。watchOS 26 與 tvOS 26:智能穿戴與客廳娛樂的新面貌watchOS 26 的設計語言也將融入更多 visionOS 的設計元素,如半透明效果、玻璃質感以及圓角按鈕,提升整體的精緻感和現代感。由於 Apple Watch 本身的硬體限制,其新增的 Apple 智能功能,如在手腕上建立 Genmoji、小元件中的通知摘要以及 Siri 的部分更新,將主要依賴配對 iPhone 的算力來實現「智能」。Apple Watch 預計將成為 AI 能力的端側互動核心 |圖片來源:Apple健康與健身功能仍是 watchOS 的核心,預計將在 watchOS 11 的基礎上,帶來更複雜的 AI 健康分析報告能力,並可能針對特定的運動類型(如力量訓練或新興的負重遠足)進行功能強化和追蹤最佳化。tvOS 26 則可能迎來其自 2015 年誕生以來的首次重大介面革新,全面擁抱 visionOS 和「Solarium」的設計風格。這意味著使用者將在 Apple TV 上看到更具現代感的半透明菜單、更簡潔且內容優先的應用設計,甚至可能引入一定的深度效果,提升客廳娛樂的沉浸感。visionOS 26:空間計算的持續進化作為本輪設計革新靈感之源的 visionOS,自身也將迎來重要的迭代,可能被命名為 visionOS 26 或 visionOS 3。此次更新的核心目標是提升 Vision Pro 的實用性和易用性,並深化其與蘋果生態系統的整合度。備受期待的新功能包括允許使用者僅通過眼球運動來滾動內容的「解放雙手」式眼動追蹤滾動;對第三方 VR 遊戲手把(如索尼 PSVR 2 Sense 控製器)的支援,以改善遊戲體驗。Apple Vision Pro 現有操作 UI |圖片來源:Apple以及更多來自蘋果官方的原生 visionOS 應用,如地圖、日曆、提醒事項等,以替代目前部分應用仍為 iPad 版本相容運行的現狀。Apple 智能的各項功能,如通知摘要、ChatGPT 整合、Siri 產品知識和視覺智能等,也將在 visionOS 上得到補齊和最佳化。03 Apple 智能,進化而非革命在 WWDC24 高調發佈 Apple 智能之後,WWDC25 在人工智慧領域的策略預計將展現出更為謹慎和漸進的姿態。尤其是在大幅升級且更智能的 Siri,已經確認推遲,部分核心功能的上線時間甚至可能要到 2026 年或更晚。因此可以預期的是,蘋果不會再在今年的 WWDC 上做出過於激進的承諾了。Apple 智能在過去一年中的表現距離 WWDC 宣傳的版本仍然有不小的差距 | 圖片來源:極客公園蘋果在生成式 AI 的浪潮中,一直被外界視為一個相對謹慎的「追趕者」。蘋果可能希望在 WWDC25 上通過「少承諾,多兌現」的務實做法,來重建因功能延遲而可能受損的信譽,並專注於其傳統優勢領域——即以使用者隱私為核心、儘可能在裝置端完成處理的 AI 實現路徑。WWDC25 在 AI 方面的一個關鍵性發佈,預計將是向第三方開發者開放蘋果的裝置端基礎模型(Foundation Models),並提供全新的軟體開發工具包。Apple AI SDK 將面向更多開發者開放系統能力 |圖片來源:Apple這些初步開放的模型,據稱規模相對較小(例如 30 億參數等級),主要針對裝置端的高效處理進行了最佳化,專注於文字摘要、基礎的圖像生成、具備上下文感知能力的文字預測以及智能分類等任務。同時,蘋果內部也在持續測試參數量高達 1500 億的更大型模型。這些改進的核心目標,是讓開發者能夠將 Apple 智能的能力更深入、更廣泛地整合到他們各自的應用中,從而創造出更具個性化、更能感知使用者場景需求的智能體驗,同時嚴格堅守蘋果一貫倡導的隱私優先原則。預計還將伴隨推出新的 AI 整合開發者 API 和功能得到增強的 Core ML 框架。去年提及的 AI 程式碼助手 Swift Assist,也可能在本次大會上迎來更新和進展說明。部分分析師甚至認為,聲勢浩大的「Solarium」視覺重新設計本身,也是蘋果的一項策略,旨在「讓使用者相信蘋果是 AI 領域的重要參與者,並將討論的焦點從技術本身的細節轉移開」。至於 Siri 的徹底重塑,這場懸念似乎仍將繼續。至少到目前為止,你還是只有 ChatGPT 可以用 | 圖片來源:極客公園當然,WWDC 作為開發者為主要群體的盛會,今年在 AI 和空間計算這兩個前沿領域,蘋果也將為開發者提供更強大的「彈藥」。如前所述,蘋果計畫向第三方開發者開放其裝置端 AI 基礎模型,並提供一系列全新的 AI 整合 API。這些 API 將支援在應用內實現本地化的 AI 摘要、基礎的圖像生成、具備上下文感知能力的文字預測與編輯,以及對照片和筆記等內容的智能分類等功能。對於 visionOS 平台,開發者將獲得新的空間計算 API,這些 API 旨在幫助他們創造出更具沉浸感、互動更自然的空間計算體驗,同時還將改進手部追蹤的精度和擴展混合現實(MR)的應用場景。此外,預計蘋果還將通過 RealityKit 等框架提供功能得到增強的 AR 開發工具。04 會有「One More Thing」的硬體嗎?WWDC 傳統上是一個以軟體發佈為絕對核心的活動,目前絕大多數分析師的預測和坊間傳聞也都表示,WWDC 2025 預計不會有重大的新硬體發佈。考慮到此次大會在軟體層面已有大規模的革新計畫(如「Solarium」設計語言的全面鋪開、「26」系列作業系統的統一命名)以及持續進行的 AI 研發投入,蘋果有足夠豐富和重磅的內容來填充主題演講,無需依賴硬體新品來「撐場面」。一場純粹以軟體為核心的 WWDC,反而能讓全球開發者與使用者更專注於理解和適應新一代作業系統版本所帶來的變化。如果說 WWDC25 上可能會有任何硬體產品露面的話,目前唯一被提及可能即將更新的蘋果產品是 AirTag 2,此前有消息稱其預計在 2025 年年中左右發佈,但具體是否會在 WWDC 期間亮相尚不確定。即便發佈,也可能僅通過新聞稿的形式低調發佈。其他傳聞中的產品,如新款 Studio Display、更廉價款的 Vision Pro  / 蘋果 AR 眼鏡或全新的智能家居中樞裝置等,其預計發佈時間最早也要到 2025 年末或 2026 年之後。傳聞中的「帶屏 HomePod」,更有可能在 2026 年發佈|圖片來源:MacRumors如果說 WWDC25 有那些核心關鍵詞,「統一」無疑是最具代表性的那個。這或許不會是一場充斥著石破天驚、令人瞠目結舌的「One More Thing」式發佈會,但仍然會為蘋果下一個十年,奠定統一的基調。總體而言,WWDC25 標誌著蘋果在鞏固其現有生態系統壁壘、精細化調整其人工智慧戰略,並為未來更高級的計算形態:更普適的空間計算、和無處不在的環境智能,鋪設關鍵基礎的重要一步。 (極客公園)