#蘋果 iOS
蘋果放大招,iOS 27相機要變“AI眼”了!
據外媒報導,蘋果正將重大 Siri 升級留到 6 月 iOS 27 的發佈,一份新報告詳細披露了即將登陸相機應用的 Siri 功能、更強大的視覺智能特性。iOS 27 相機應用將迎來 Siri 模式蘋果公司正計畫將人工智慧更深入地整合到 iPhone 的相機應用中,在其即將推出的 iOS 27 作業系統中,除了標準的照片和視訊選項外,還將新增一個 Siri 模式。外媒進一步解釋稱,蘋果計畫"將視覺智能功能——目前繫結在相機控制按鈕上——移入相機應用本身",以提高該 AI 功能的可發現性。目前,視覺智能功能也可通過控制中心訪問。蘋果最初為不具備相機控制按鈕但支援 Apple Intelligence 的 iPhone 機型加入了這一功能。視覺智能還可以繫結到鎖屏介面或操作按鈕,但在 iOS 26 中,相機應用明顯缺少該功能。外媒將 Siri 模式描述為視覺智能的增強版本。該功能目前可連接 ChatGPT 和Google圖片搜尋。據報導,在 iOS 27 中,蘋果正在"重新設計體驗,新增一個以 Apple Intelligence 標誌為風格設計的快門按鈕"。通過相機控制按鈕快捷訪問視覺智能的功能仍將保留,但相機應用的整合將向更多使用者展示這一功能。視覺智能功能將迎來升級Siri 模式將在現有視覺智能功能基礎上增加新特性。例如,iOS 27 將包括"掃描食品包裝上的營養成分標籤以記錄飲食資訊"的能力,或通過掃描資訊加入聯絡人詳情。今天的新細節緊隨資深記者古爾曼昨天的報導,他透露蘋果計畫在照片應用內推出三項新的 AI 相關功能。iOS 27 將改版照片應用的編輯介面,新增Apple Intelligence Tools(蘋果智能工具) 專區。該菜單內將包含三個選項,可在數秒內完成照片修改。擴展(Extend):允許使用者在原始畫幅之外生成額外圖像內容。報導舉例:使用者拍攝地標特寫後,可通過該工具補全周邊景物。使用者可通過手指拖動照片邊緣,控制擴展範圍。增強(Enhance):自動最佳化畫質、光線、色彩等參數。重新構圖(Reframe):可調整空間照片的拍攝視角。不過報導指出,這些新編輯功能的開發並非一帆風順。尤其是擴展與重新構圖工具,在內部測試中表現不穩定。蘋果可能會根據底層 AI 模型的最佳化進度,推遲發佈或縮減功能。iOS 27 預計在 6 月 8 日的 蘋果 WWDC 開發者大會上正式發佈。除照片編輯新功能外,本次更新還將大幅升級 Siri 體驗,同時蘋果也會重點修復漏洞、提升系統整體穩定性。 (TechWeb)
XChat 來了!馬斯克版微信正式發佈,國區可下載
近日,馬斯克旗下的 X 平台突然官宣,推出一款全新獨立加密聊天APP ——XChat,引發廣泛關注。XChat 由蘋果 iOS 首發,將於 2026 年 4 月 17 日在 App Store 面向全球使用者開放下載,Android版本預計會在後續陸續推出。最讓國內使用者驚喜的是,XChat 支援簡體中文,且中國大陸區 App Store(國區) 也可以下載。不過門檻也不算低,裝置需升級至 iOS/iPadOS 26.0 以上,且僅限 16 歲以上使用者使用。按照老馬的說法,XChat 最大的特色就是不需要手機號註冊,直接繫結 X 帳號體系。但這有個很現實問題,由於國內無法直接訪問 X 服務,即便國內普通使用者下載了 XChat,也沒法正常登錄。這款應用的目標使用者,更多還是留學生、海外華人、跨國辦公以及能訪問國際網路的特殊使用者群體。作為一款主打隱私安全的聊天軟體,XChat 採用 Rust 語言開發,全程支援端到端加密,官方承諾無廣告、不追蹤使用者資料。功能上,這款聊天應用支援文字、圖片、檔案傳輸,音視訊通話,還能建立最高 481 人的大群聊。隱私功能更是亮點拉滿:消息僅收發雙方可見,支援閱後即焚、雙向撤回,還帶有防截圖或截圖提醒功能。此外,XChat 深度整合了 Grok AI 大模型,它能在聊天中直接處理檔案、規劃行程,實用性拉滿。XChat 被看作是馬斯克打造西方版 “超級應用(Everything App)” 的關鍵一步。早在去年底,馬斯克就在播客節目中公開“表白”微信,揚言要把 X 打造成升級版微信。他吐槽海使用者在不同 App 間切來切去像拆盲盒,遠不如中國人“一個微信包辦生活”來得優雅。所以,XChat 並不是簡單的聊天工具,它是馬斯克將 X 打造為超級應用的關鍵一步。這也是 XChat 被外界戲稱為 “馬斯克版微信”的原因。雖然 XChat 目前看起來更像是一個“純淨版 Telegram + Grok AI”,但老馬的野心顯然是後續的社交、支付與服務全生態整合。目前 XChat 的熱度居高不下,尤其是罕見繞過國區限制,讓不少國內使用者好奇。但因受限於 X 服務與加密通訊規則,目前在國區 App Store 無法直接搜尋到,但可通過直達連結開啟預約下載。 (Netskao)
蘋果iOS 27大更新:Siri迎“史詩級升級”
據外媒報導,蘋果計畫在 iOS 27 中推出的新版 Siri,或將支援在一條指令裡同時處理多個請求。借助該功能,使用者可下達多步驟復合指令,比如讓 Siri 規劃前往某地的路線,再把路線通過資訊發給他人。長期以來,Siri 絕大多數請求都只支援單條指令,無法解析包含多個環節的查詢。即便 Siri 無需喚醒詞就能回答後續問題,這些請求也必須分開下達。支援多指令處理,將是蘋果自 2024 年 6 月起研發的 Apple Intelligence (蘋果智能)升級的一部分。新版 Siri 會擁有更強的個人上下文理解能力,能識別使用者螢幕內容,可在應用內及應用間完成更多操作。Siri 還能聯網彙總資訊,這項功能蘋果可能命名為 全球知識問答(World Knowledge Answers),並有望通過整合 Image Playground 獲得圖像生成能力。蘋果計畫把 Siri 打造成能與 Claude、ChatGPT、Gemini 抗衡的聊天機器人。這類機器人可輕鬆解析包含多個變數與待執行操作的自然語言請求。蘋果正在開發一款獨立的 Siri 應用用於聊天互動,同時這款助手也會深度融入 iOS、iPadOS 與 macOS 系統。新版 Siri 將同步登陸 iOS 27、iPadOS 27、macOS 27,蘋果預計在 WWDC 2026(6 月 8 日開幕)發佈會上預覽這些系統更新。目前尚不確定 Siri 新特性是否會隨 iOS 27 首個開發者測試版同步上線,還是後續分批推送。蘋果計畫在 9 月前推出更智能的 Siri,但不排除部分功能推遲到明年春季的 iOS 27 版本更新。外媒此前還報導,iOS 27 上的 Siri 將迎來重大改版。外媒預計其介面將重新設計(可能聯動靈動島),蘋果應用內會新增全域「詢問 Siri」按鈕,鍵盤上方也會出現 「Siri 撰寫」按鈕。 (TechWeb)
開放 Siri,蘋果決定打開兆「AI 生態」
蘋果正在把 Siri ,變成一個 AI 分發平台。多年自研無果後,蘋果對於 AI,現在徹底想通了。當地時間 3 月 26 日,外國媒體曝光蘋果計畫在 iOS 27 中開放 Siri,讓任何通過 App Store 上架的 AI 服務都能接入其中。無論是 ChatGPT,Google 的 Gemini、Anthropic 的 Claude,理論上都可以成為 Siri 背後的「大腦」。而 OpenAI,將失去它在 Apple Intelligence 和 Siri 體系中的獨家地位。這不是一次簡單的產品決策轉變,而是蘋果 AI 戰略的一次根本性轉向。01 從獨家到開放要理解蘋果這次轉變的重量,得先回到 2024 年。當蘋果在 WWDC 上宣佈與 OpenAI 合作,把 ChatGPT 整合進 Siri 的時候,外界的解讀普遍是「蘋果在 AI 競賽中掉隊了,只好找 OpenAI 來救場」。這個敘事有一定道理——蘋果自研大模型的進展明顯落後於 Google 和微軟,用 ChatGPT 來填補能力缺口,是最快的解決方案。但如果只把這次合作看成「技術補缺」,就低估了蘋果的算盤。蘋果歷史上有一個非常一致的戰略邏輯,用「平台鎖定」來維持生態壁壘。App Store 是這個邏輯最典型的體現——蘋果不自己做所有的應用,而是把最好的開發者吸引進來,然後收取過路費,控制分發權。現在,蘋果正在用同樣的邏輯,重新定義 AI 時代的「分發權」。從獨家繫結 ChatGPT,到開放所有 AI 服務,蘋果的角色悄然完成了轉變——從一個「AI 技術採購方」,變成了一個「AI 能力的分發平台」。App Store 管的是應用的分發,而未來的 Siri 管的,是 AI 能力的分發。這兩件事的商業邏輯,其實是一回事。更值得注意的細節是時間點。就在幾天前,Apple 剛剛慶祝了公司成立 50 周年。庫克在給全體員工的信中回顧歷史、強調價值觀。而與此同時,悄悄推進的,是這個足以重塑 AI 格局的戰略決策。五十歲的蘋果,選擇在這個節點打開 Siri 的大門,某種程度上也是一種宣示——我們知道自己要去那裡。02 作為「第一入口」的 Siri對 OpenAI、Google 和 Anthropic 來說,能否進入 Siri 生態,意味著截然不同的市場地位。想像一個普通 iPhone 使用者的日常——他不會專門打開 ChatGPT 或 Gemini 的 App,他只會對著手機說「嘿 Siri」。過去,這個入口只通往一個 AI;未來,這個入口將變成一個 AI 的選擇介面。誰能站在這個選擇介面的最顯眼位置,誰就贏得了移動端最稀缺的資源,使用者注意力的第一觸點。這解釋了為什麼 Google 對進入 Siri 生態的意願會如此強烈。Gemini 在 Android 端已經是默認助手,但 iPhone 的使用者規模是 Google 無論如何都不能忽視的。如果 Gemini 能出現在 iOS 27 的 Siri 選項裡,那意味著 Google 的 AI 觸達能力將實現跨越式的擴張。Anthropic 的情況則更有意思。Claude 目前更多被企業使用者使用,在 C 端的知名度遠不如 ChatGPT。但進入 Siri 生態,可能是 Claude 在消費級市場建立存在感最快的方式,沒有之一。OpenAI 失去獨家地位之後,處境會變得微妙。ChatGPT 依然是最知名的 AI 品牌,在 Siri 的選項列表裡,大機率仍然是很多使用者的第一選擇。但「被選擇」和「默認繫結」之間,存在巨大的心理距離。曾經無需競爭的位置,現在要靠產品力來爭取——這對 OpenAI 來說,既是壓力,也是一種市場的公平。值得一提的是,iOS 26.4 的更新已經悄悄埋下了伏筆,這個版本在 CarPlay 中加入了對「基於語音的聊天機器人應用程式」的支援。這個不起眼的功能,現在回看,很可能就是 Siri 開放生態的前期測試。蘋果很少做沒有戰略意圖的功能,這個規律在這件事上再次得到印證。03 兆美元「AI App Store」開放 Siri 接入第三方 AI,背後還有一個顯然易見的商業邏輯——蘋果要從 AI 生意裡抽成。目前還不清楚蘋果會以什麼方式向接入 Siri 的 AI 服務收費。但可以參考的是 App Store 的模式——蘋果對應用內購收取 15%-30% 的抽成,這個「蘋果稅」長期以來是科技行業最大的爭議之一,也是蘋果服務收入的核心來源。如果 AI 服務通過 Siri 觸達使用者並產生訂閱收入,蘋果是否會用類似的邏輯收取通道費?這個問題目前沒有答案,但這個商業想像空間是真實存在的。更深遠的影響在於,蘋果正在把「AI 接入權」,變成一種新的稀缺資源。在 PC 時代,瀏覽器的默認搜尋引擎位置是一塊價值連城的地產——Google 每年付給蘋果超過 200 億美元,就是為了保住 Safari 的默認搜尋權。現在,Siri 的「默認 AI」或「優先推薦位」,將成為 AI 時代同等量級的稀缺資源。考慮到 iPhone 全球有超過 10 億的活躍使用者,這塊地產的估值,不難想像。當然,這套邏輯能否成立,還有一個前提,蘋果得先讓 Siri 本身變得足夠好用——這正是 WWDC 2026 的核心壓力所在。蘋果計畫在 6 月 8 日的主題演講上,正式揭開新 Siri 的面紗,同期宣佈第三方 AI 整合方案。根據目前流出的資訊,iOS 26.5 的第一個 beta 版本可能在月底就會出現,其中將包含首批由 Gemini 驅動的 Siri 功能。說白了,蘋果現在打的邏輯是,我不需要有最好的 AI,我只需要是最好的 AI 的入口。這個戰略,像極了蘋果在音樂串流媒體時代的做法——iTunes 和 Apple Music 未必比 Spotify 技術上更先進,但掌握著硬體端的分發權,就等於掌握了市場的話語權。04 「開放」和「博弈」當然,「開放」這個詞,用在蘋果身上,永遠需要加引號。蘋果的開放,從來不是無條件的開放。App Store 的開放,建立在嚴格的稽核制度和抽成規則之上。Siri 的開放,同樣不會是讓 AI 廠商自由進出的綠色通道。蘋果掌握著接入標準的制定權、使用者介面的設計權,以及最終的稽核權。這意味著,進入 Siri 生態的 AI 服務,必須按蘋果的規則打球。資料隱私的邊界在那裡、AI 回覆的內容能到什麼尺度、使用者的切換路徑怎麼設計,蘋果一定會保留最終的決定權。對 OpenAI 和 Google 這樣的 AI 巨頭來說,接受蘋果的規則並不是一件舒服的事。但如果不接受,就意味著在全球最重要的移動平台上缺席。這道選擇題,其實沒有什麼好選的。業內有一種觀點認為,大模型的競爭最終會走向「商品化」,誰的模型都差不多,那時候真正有價值的是分發管道。如果這個判斷是對的,那蘋果現在做的事情,就是在提前卡住未來最值錢的位置。五十年前,蘋果用「讓電腦成為人人可用的工具」改變了世界。現在,蘋果想用「讓最好的 AI 觸手可及」再做一次這件事。只不過,這一次,AI 的「觸手可及」,要通過蘋果制定的規則來實現。這個代價,大模型廠商們正在權衡。而結果,6 月 8 日的 WWDC,我們就會看到第一個答案。 (極客公園)
【WWDC2026】iOS 27將推重磅升級:新版Siri對標ChatGPT但或需付費
據外媒報導,蘋果公司計畫在上半年舉辦的WWDC開發者大會上發佈全新的iOS 27作業系統,這一版本將隨iPhone 18系列首發。據悉,此次更新的核心亮點是代號為“Campos”的全新Siri聊天機器人,蘋果旨在將其打造為能與Anthropic Claude、GoogleGemini及OpenAI ChatGPT直接競爭的產品。這款新一代Siri將整合至iOS 27、iPadOS 27及macOS 27中,全面取代現有的Siri版本。據悉,蘋果計畫採用基於GoogleGemini的定製模型來驅動該機器人,使其具備媲美主流聊天機器人的自然語言對話能力。使用者既可以通過語音喚醒詞,也可通過長按裝置側邊按鈕來啟動它。在功能層面,新版Siri不僅支援網頁搜尋、生成圖片、輔助程式設計、資訊總結及檔案分析,還能深度呼叫裝置上的個人資料。它能查看當前的窗口內容和螢幕顯示,甚至直接修改系統設定。此外,Siri將深度整合至蘋果旗下的所有原生應用,包括照片、郵件、資訊、音樂和Apple TV,能夠精準讀取並分析應用內內容,以理解和執行使用者指令。按照蘋果的規劃路線圖,iOS 26.4將率先推出具備個性化功能的Siri,落地此前承諾的Apple Intelligence;而功能更為強大的聊天機器人版Siri則將在iOS 27中正式亮相。值得注意的是,考慮到無論是使用自有的私有雲伺服器還是Google的Tensor伺服器,強大的算力支撐都意味著高昂的營運成本。鑑於Siri處理的每一個問題和生成的每一張圖片都會產生費用,蘋果計畫向使用聊天機器人版Siri的使用者收取費用,不過具體的收費標準目前尚未披露。 (TechWeb)
OpenAI蘋果化:ChatGPT就是iOS ,幾分鐘造出的Agent要代替App
當地時間10月6日,OpenAI在舊金山舉辦DevDay 2025開發者大會。在大會正式開場前5小時,AMD與OpenAI的合作消息公佈,OpenAI將在未來數年部署高達6GW(千兆瓦)的AMD Instinct GPU。AMD已向OpenAI發行最高1.6億股認股權證,行權條件與晶片部署進度及股價里程碑掛鉤,如果OpenAI全額行權,可能獲得AMD約10%的股權,AMD股價一度暴漲30%。有開發者吐槽“又被資本操作搶戲”,也有人認為這是刻意編排,先講底層算力,再講上層工具,恰好符合OpenAI從晶片到模型到應用的一體化敘事。回到這次DevDay上,OpenAI發佈了Apps SDK(在ChatGPT內建構應用的完整框架)、AgentKit(快速建構AI Agent的工具套件)、Codex正式版以及GPT-5系列和Sora2等模型的API。Sam Altman開場公佈了一組增長資料,開發者數量從2023年的200萬增長到400萬,翻了一番。ChatGPT的周活躍使用者從1億飆升至8億,增長了8倍;API每分鐘處理的token量從3億暴漲到60億,這是20倍的增長。8億周活意味著超級應用,這個體量已經具備了成為平台的基礎設施。DevDay中Apps SDK是最值得關注的重點,它標誌著ChatGPT更像一個平台和作業系統了。Altman的判斷很直接,AI已經從人們玩耍的東西,變成了人們每天建構的東西。這次DevDay的目標,就是讓更多開發者能直接在ChatGPT上建構應用和Agent,並且在這個擁有8億使用者的平台上開發和分發。OpenAI開始蘋果化了。Apps SDK:在ChatGPT內做應用OpenAI曾經嘗試過讓開發者在ChatGPT上建構應用,那就是2023年推出的GPTs。但GPTs本質上只是Prompt範本,能力有限且生態混亂,已經被OpenAI放棄。去年底Anthropic推出了MCP開放標準,試圖為AI應用互操作性提供統一框架,而今天發佈的Apps SDK,則是OpenAI基於MCP標準,再次嘗試讓ChatGPT成為一個應用平台。Apps SDK是一個完整的開發框架,讓開發者能在ChatGPT內部建構真正的互動式應用。開發者可以用TypeScript或JavaScript編寫後端邏輯,通過MCP介面連線據、觸發操作,並渲染完全互動式的使用者介面。這不是簡單的API呼叫,而是在ChatGPT對話方塊裡運行的“小程序”。舉幾個現場演示的例子就能明白它的能力,Coursera應用可以在對話中嵌入媒體播放器,使用者邊看課程邊向ChatGPT提問;Zillow能展示可篩選的互動地圖,使用者說“找帶院子的三居室”,地圖即時過濾結果;Canva則能直接根據對話生成海報,並把海報轉換成完整的PPT。OpenAI還推出了應用對話(Talking to Apps)機制。Apps SDK提供了一套API,允許第三方應用將內部上下文即時暴露給ChatGPT。當你在Coursera應用裡看到視訊第5分鐘,ChatGPT知道你正在學什麼章節,當你在Zillow地圖上點開某套房子,ChatGPT能精準理解你關注的是那個地址、什麼價位。深度整合讓對話式互動真正有了實用價值。現場演示中,當演示者說“Spotify,給我周五派對做個歌單”,ChatGPT自動調出Spotify應用,螢幕上顯示“使用Spotify生成此答案”的提示,幾秒後歌單就出現在對話方塊裡,可以直接點選播放。整個過程流暢自然,就像在iOS上切換App一樣。首批合作應用包括Booking.com、Expedia、Figma、Spotify、Zillow、Canva和Coursera,未來幾周還會加入DoorDash、Uber、Target、OpenTable等。Apps SDK今天開放預覽版,開發者可以在Developer Mode中測試應用。今年晚些時候,OpenAI將開放正式提交通道,並提供應用目錄供使用者瀏覽。面向Apps SDK開發者的設計規範配圖Altman還透露了商業化計畫,Apps SDK未來將支援新的Agentic Commerce Protocol,允許使用者直接在ChatGPT內部即時結帳。很多人會問GPTs不是已經失敗了嗎,Apps SDK會重蹈覆轍嗎?GPTs門檻接近零程式碼,但能力也被侷限,回覆始終是一條條消息。Apps SDK則是程式碼為中心。開發者需要在自己的伺服器上編寫真正的應用程式碼,實現MCP伺服器介面,聲明OAuth 2.0登錄和互動式UI元件。ChatGPT只是把App嵌入對話流裡,真正的邏輯、狀態管理和資料儲存都在開發者手中。Apps可以彈出富互動元件(地圖、表單、媒體播放器)、長時間保持session,並可在後台自行拉取和推送資料。換句話說,GPTs是範本,Apps in ChatGPT是完整的小程序。GPTs和GPTStore既不像App Store那樣標準化,也不像外掛那樣通用,多數GPT缺乏區別化價值,使用者難以形成持續使用習慣,開發者又難以變現、使用者難以發現優質內容,最終生態陷入空轉。Apps SDK則完全不同。開發者必須通過實名驗證、伺服器驗證和功能測試才能上架。稽核前置,並引入了年齡分級和權限管理,類似App Store的標準。Altman還暗示會有更正式的收入分成方案。在ChatGPT上,一個新的iOS的雛形就這樣長了出來。AgentKit:8分鐘造出的AgentApps SDK建構的是ChatGPT的應用生態,而AgentKit則是OpenAI給開發者提供的Agent開發工具箱。Altman的判斷是,AI已經從“你提問的系統”進化到“能為你做很多事情的系統”,也就是Agent。但他也坦言,符合定義的Agent成功落地的很少。AgentKit是一個完整的工具套件,包含四個核心元件:Agent Builder,這是一個可視化畫布平台,讓開發者能像使用Canva一樣拖曳設計Agent的邏輯、步驟和工作流。它建立在OpenAI的Responses API之上,支援if-else邏輯節點、循環、使用者審批節點、檔案搜尋和資料轉換等模組化元件。開發者可以從預設範本開始(如客服機器人、資料增強、文件對比),也可以從零搭建自訂流程。ChatKit,一個可嵌入的聊天介面元件。開發者可以把這個介面整合到自己的網站或應用中,帶來ChatGPT等級的對話體驗,同時保留自己的品牌、工作流和產品特色。它能處理流式響應、管理對話執行緒、顯示模型思考過程,讓整合聊天UI的複雜工作變得簡單。Connector Registry,一個企業級的連接管理中心。管理員可以通過控製麵板統一管理Agent如何連接內部工具和第三方系統,設定權限、監控使用情況,同時保證安全性和合規性。Agent Evals(評估工具),提供性能測量和最佳化能力。包括逐步追蹤評分(Trace Grading,理解Agent的決策步驟)、評估資料集、自動化提示詞最佳化,以及在OpenAI平台上直接對外部模型運行評估的能力。在現場OpenAI工程師Christina Huang8分鐘的演示中。她從零開始,用Agent Builder建構了一個名為Ask Froge的DevDay網站Agent。快速地將一個靜態的會議網站建立一個智能問答助手,以提升使用者體驗。她先設定了Agent的基本指令,然後加入了預建構的Guardrails(防護欄)用於PII資訊掩碼,接著連接了DevDay的日程資料,最後加入了自訂Widget來顯示會議時間表。整個過程不到8分鐘,Agent就部署到了DevDay官網,觀眾可以現場訪問使用。企業案例中,零售巨頭Albertsons用AgentKit建構了幫門店經理分析銷量的Agent,當某個品類銷量下降(比如冰淇淋),系統會基於季節性趨勢、歷史資料和外部因素(天氣、節假日)給出診斷和建議。行銷軟體公司HubSpot則用它改進了Breeze AI客服工具,Agent能整合知識庫、尋找當地治療方案和保險政策細節,生成更有針對性的回覆。Box、Canva和Evernote也已開始使用該平台。Altman說這是我們當初造第一個Agent時希望擁有的工具。降低門檻的邏輯很清晰,讓更多人能造Agent,OpenAI才能搶佔Agent開發生態的制高點。而這個生態的門檻因為模型能力提升而足夠低的時候,app就會被agent們替代。Codex和模型更新除了應用和Agent,OpenAI還宣佈了一系列基礎設施更新。Codex正式可用,OpenAI的軟體工程Agent Codex結束研究預覽,進入通用可用(GA)階段。Codex現在運行在專門訓練的GPT-5-Codex模型上,這個模型在程式碼重構和程式碼審查等Agentic程式設計任務上表現更出色。自8月初以來,Codex的日均消息量增長了10倍,已處理超過40兆個token。過去兩三個月裡,開發者社區能明顯感覺到Codex很火。一方面,OpenAI用GPT-5-Codex把"AI程式碼這條垂直賽道往前推了一步,在程式碼質量和推理能力上形成優勢,另一方面,Codex提供了價格透明、場景統一、穩定可預期的開發體驗。相比之下,不少開發者抱怨Claude Code存在限流、質量波動等問題,甚至有人已經把主要精力轉到Codex上。這次正式發佈,是OpenAI在程式碼生成領域持續發力的一步。OpenAI展示了內部資料,工程師在使用Codex後,每周完成的Pull Request數量提升了70%,幾乎所有OpenAI的PR都經過Codex審查。Codex還新增了三個企業功能:Slack整合(可以直接在團隊頻道里讓Codex寫程式碼或回答問題)、Codex SDK(讓開發者在自己的工作流中嵌入Codex能力)、以及管理工具(包括環境控制、監控和分析儀表板)。模型和API更新方面,GPT-5 Pro API向所有開發者開放,這是OpenAI目前最智能的模型,專為需要高精度和深度推理的場景設計,如金融建模、法律檔案分析和醫療診斷,定價為每百萬輸入token 15美元、每百萬輸出token 120美元。OpenAI剛剛發佈全新的Sora 2模型及同名Sora App,應用上線後迅速走紅,Sora 2、Sora 2 Pro API也進入預覽階段,這個新一代視訊生成模型在可控性上有巨大飛躍,能根據詳細指令生成風格化、構圖精良的視訊,還能配上豐富的聲音景觀、環境音訊和同步音效。Sora 2 輸出每秒 0.1 美元,Pro 輸出每秒0.3 美元。GPT-Realtime-Mini則是一個更小、更便宜的語音模型,比之前的高級語音模型便宜70%,但音質和表達力保持一致。OpenAI認為語音將成為人們與AI互動的主要方式之一,更經濟的模型能讓語音應用更快普及。平台化的野心這次DevDay最重要的訊號是,ChatGPT不再只是一個Chatbot,而是正在成為一個完整的應用平台。Apps SDK讓開發者能觸達8億使用者,AgentKit降低了Agent開發門檻,Codex提升了軟體開發效率。OpenAI正在建構一個從應用分發、開發工具到基礎設施的完整生態。從現場演示來看,這些Agent更像是對話式的App,它們依然需要後端邏輯、資料管理和UI互動,只是把入口從圖示點選變成了自然語言對話。這是互動方式的革命,但軟體開發的本質沒有改變,你還是需要懂業務、懂技術、懂使用者需求。蘋果推出App Store時,沒人想到十年後會有幾百萬個App。OpenAI推出了Apps SDK,現在的問題不是Agent是否會替代App,而是開發者們是否真的會來,在ChatGPT上“Build something new”。 (矽星人Pro)