#AI商業帝國 | 熱門關鍵字 | 鉅亨號

如果說，前幾天剛剛登頂App榜的Sora2是OpenAI技術硬實力的直觀展現，那麼美國時間10月6日舉辦的OpenAIDevDay，則更清晰地展示了OpenAI的野心。整場發佈會的內容可拆解為四個部分，除了API開放之外，其他三個部分一起構成了OpenAI的未來藍圖，也可能是所有AI公司的未來路徑：建構一個以AI為絕對核心的全新軟體生態體系。發佈會上展示的功能，大多可視為過去兩年 AI 技術演進的線性延伸，並無太多意外之處。但 OpenAI 此次首次將這一藍圖更系統化、平台化地呈現出來。現在，就讓我們一起逐步拆解，這個宏大的藍圖都由什麼建構而成。LLM，作為軟體的唯一入口“LLM即將成為所有軟體的入口”，這個在2024年人們腦中還略顯模糊的想像，到2025年已然成為共識。OpenAI此次推出的Apps SDK，基於已建成的MCP體系，首次將這一願景的實現路徑完整呈現出來。Apps SDK是一套完整的開發堆疊，允許開發者在ChatGPT內部建構真實、可互動的應用程式。通過這套SDK，開發者可以連接自己的資料、觸發具體操作、並渲染出完全互動式的使用者介面。此前，Claude、GitHub Copilot等其他產品雖有工具使用能力，但只是將外部服務的結果以文字形式返回，缺乏真正的上下文理解和自然的互動介面。換言之，過去的工具難以真正被“用起來”，而OpenAI的Apps SDK讓使用者能在LLM中像在電腦上一樣使用App。現場展示了這樣一個案例：當使用者正在為寵物狗業務進行頭腦風暴時，可以直接“@”出Canva，它會立刻理解之前使用者和它聊到的所有點子，並根據“色彩豐富、異想天開”的模糊要求，生成一系列精美的海報。如果靈感迸發，使用者甚至可以要求它把其中一張海報直接擴展成一份完整的商業計畫書（Pitch Deck）。而當業務需要擴張時，ChatGPT會根據上下文建議使用者考慮“匹茲堡”這個城市，並無縫喚起Zillow應用，直接擴大到全螢幕，幫助尋找合適的房源，使用者只需要再在ChatGPT內提出新要求，就能讓它篩選出“帶院子的三居室”。接著，使用者還可以跟它繼續溝通，在ChatGPT裡問它諸如“這個房子離狗狗公園有多遠”之類的問題。這一系列操作行雲流水，背後展現的是Apps SDK將不同應用無縫融合的能力。使用者無需在不同軟體間切換，只需通過對話，就能在一個統一的入口中，讓最合適的工具在最恰當的時機出現，並協同完成一項複雜的任務。OpenAI發佈的重要進展是基於MCP，使開發者可以設計其應用的邏輯和介面。結合GPT本身對圖像的識別能力，它讓App更“自然”地融合在了對話過程中。因為對話和理解的便捷性，尤其是OpenAI在這場展示中著重強調的對上下文的記憶和理解，使用者可以很容易地在GPT中呼叫多種App去完成同一個工作。演示中有一段跨對話記憶的展示，ChatGPT在另一個對話中延續了上一個對話的話題這種強大的上下文理解能力，正是LLM有望成為主流軟體入口的核心競爭力之一。而App也不再是功能孤島，而是能被隨時喚醒、能充分理解對話背景的“外掛”，並以最合適的使用者介面融入當前的對話流中。使用者的主入口只有一個，就是ChatGPT的對話方塊。那如何讓App更好地適應使用者需求，和對話更好的連接，以推動萬物都在LLM內的大計呢？這就要靠這場發佈會的第二部分，AgentKit了。Agent時代來得太慢我們來推一把此前行業間普遍將2025 年稱作 “Agent元年”，可如今時間已行至10月，市場上卻始終未出現能復刻去年 Manus 那般、引發行業震盪的現象級Agent產品。OpenAI希望讓Agent時代來得更快，他們推出了號稱“最簡便、快捷”的Agent開發工具包——AgentKit。面對Dify、Coze等市場主流工具，OpenAI的答案是：讓一切回歸可視化。AgentKit的核心是一套可視化的畫布“Agent Builder”，開發者不再需要從零開始編寫程式碼，而是通過拖曳和連接不同的功能節點，比如檔案搜尋等，來直觀地設計和測試複雜的業務流程。此外，AgentKit還提供了名為“ChatKit”的可嵌入聊天元件，讓開發者能輕鬆地將具備品牌定製能力的聊天介面整合到自己的應用中。同時，它還有一個Connector功能，可以直接把Agentkit的Agent工具建構和企業內部資料和工具聯絡到一起。為了展示AgentKit的便捷性，產品經理Christina在現場僅用了8分鐘，從零開始為一個靜態的DevDay活動官網建構並上線了一個智能問答Agent。從演示中可以看到，AgentKit只有Agent、End（結束）、Note（筆記）三個功能節點，各個Agent間，可以用條件、同時進行和使用者許可三個邏輯點決定分叉走向。每個Agent中，可以使用檔案搜尋、安全防護和MCP應用這三個工具。也可以將他們作為功能點加在外部。目前看，這個AgentKit並沒有整體在設計邏輯上超越Dify類工具很多，但確實更精簡，更易用。但是，如果想讓習慣了Dify類使用者真正轉投OpenAI門下，還有兩個重要的原因：第一，是RFT（強化學習微調）的定製。第三方工具只能將GPT作為API“黑箱”呼叫，而AgentKit則能深入模型內部進行最佳化。目前，OpenAI已經開始實驗對GPT-5的RFT功能，開發者可以通過RFT來定製OpenAI的推理模型，還可以專門訓練模型，讓其學會在最恰當的時機、以最優的方式呼叫工具，從而實現更好的推理效果。這對於想用GPT作為基礎模型，達成最好的Agent效果的公司和開發者來講，是個巨大的優勢。第二，是AgentKit的Evals類股。它增加了“資料集建構”、“跟蹤評估”和“自動化提示最佳化”等能力，允許開發者對工作流進行端到端的評估，精準定位並修復問題。這對於Agent開發而言，確實十分便捷。今天的展示，不禁讓我想到了當年OpenAI發佈的Agentalpha版本，就是GPTStore的命運。當時，模型主要依賴上下文，無法有效呼叫工具和資料，導致應用場景受到很大限制。而當下，Agent面臨的一些具體落地問題，這個框架是否能夠解決還是疑問重重。但是，OpenAI已經開始做了，這些問題也許可以更快地找到解法。Codex，小露了未來程式設計的一手不論是開發Agent，還是部署App，最底層的都是程式設計。據Sam Altman介紹，自八月上線以來，Codex已經處理了40T的token，成為OpenAI增長最快的產品之一。從程式設計師社群的反饋來看，Codex的出現確實讓Claude一直以來的程式設計王者地位搖搖欲墜。本次發佈會中，Codex正式從研究預覽版轉為正式版（GA），其主要更新來自於對企業和工程團隊的深度支援，具體可以分為三個方面：首先是Slack整合。這是一個被社區呼籲已久的功能。現在，團隊可以直接在日常溝通的Slack頻道中呼叫Codex，讓它在對話流裡直接回答技術問題或編寫程式碼片段，無需切換應用。其次是推出了全新的Codex SDK。這使得企業可以將Codex的能力作為模組，自動化並擴展到自己內部的開發工作流中，讓Codex能更好地融入企業現有開發體系。最後，OpenAI提供了一套新的後台管理與報告工具。這包括了環境控制、監控、分析儀表盤等一系列功能，讓企業的管理者能夠更好地追蹤和管理Codex在組織內的使用情況。但這些升級，遠不如現場最後的那段演示來得震撼。演示者Raman的目標是僅通過對話，讓現場的語音助手呼叫Codex SDK，命令它做一個滾動的開發者名單。Codex在後台即時修改了前端應用的React程式碼，螢幕上立刻開始滾動開發者的姓名。這個場景就是OpenAI預想的軟體開發的未來——你甚至不需要看到程式碼，軟體就可以在與你的對話中，即時地自我迭代和進化。API開放GPT-5 Pro、Sora 2全面上線除了上述三個構成全新生態的類股，發佈會第四部分是相對傳統的API更新。首先，OpenAI迄今為止最強大的模型GPT-5 Pro 正式通過API向所有開發者開放。其次，為了普及語音互動，OpenAI發佈了一款更小、更便宜的語音模型 GPT Real-time mini。它的成本比之前的版本降低了70%，但保留了同樣優秀的音質和情感表現力，無疑將大大降低開發者建構語音應用的門檻。而其中最重要的是Sora 2 API的開放。這意味著，開發者終於可以將OpenAI頂級的視訊生成能力，整合到自己的產品中。這個API的開放，表明未來在各種應用中，我們都可以方便地用上Sora 2來創作內容了。商業帝國的輪廓已經蓋住了AGI的圖景今年的旗艦模型GPT-5，儘管依舊強大，卻缺少了當初GPT-4發佈時那種跨時代的驚豔感，它更像是一次穩健但可預期的迭代。Sora 2的發佈也是如此，其真正的驚豔之處，並非視訊生成技術本身相較於早它發佈的Veo3等競品。而是其產品團隊精準洞察到了社交媒體的下一個爆點：將真實的人物無縫融入AI生成的視訊中。這是一個天才的產品構想，但它的光芒更多來自於商業嗅覺，而非底層的技術革命。此次 DevDay，正是這一趨勢的集中爆發。無論是試圖將所有應用納入對話方塊的 Apps SDK、旨在統一開發標準的 AgentKit，還是面向企業深度定製的 Codex，OpenAI 的每一步動作，都在朝著一條早已清晰的路徑深耕：搭建一個以自家大模型為絕對核心、封閉且極具掌控力的軟體生態。只是，我們分明能感受到，OpenAI 早年那種自帶的神秘感與對未知領域的探索氣質，正變得越來越淡；曾經讓人腎上腺素飆升的 “驚豔感”，似乎也在慢慢褪色。如今的 OpenAI，商業帝國的輪廓愈發清晰，甚至已經隱隱蓋住了通用人工智慧（AGI）的遠景圖景。 (騰訊科技)