#AI商業帝國
一文讀懂OpenAI DevDay:應用、Agent、程式碼三連擊,勾勒AI商業帝國的統治藍圖
如果說,前幾天剛剛登頂App榜的Sora2是OpenAI技術硬實力的直觀展現,那麼美國時間10月6日舉辦的OpenAIDevDay,則更清晰地展示了OpenAI的野心。整場發佈會的內容可拆解為四個部分,除了API開放之外,其他三個部分一起構成了OpenAI的未來藍圖,也可能是所有AI公司的未來路徑:建構一個以AI為絕對核心的全新軟體生態體系。發佈會上展示的功能,大多可視為過去兩年 AI 技術演進的線性延伸,並無太多意外之處。但 OpenAI 此次首次將這一藍圖更系統化、平台化地呈現出來。現在,就讓我們一起逐步拆解,這個宏大的藍圖都由什麼建構而成。LLM,作為軟體的唯一入口“LLM即將成為所有軟體的入口”,這個在2024年人們腦中還略顯模糊的想像,到2025年已然成為共識。OpenAI此次推出的Apps SDK,基於已建成的MCP體系,首次將這一願景的實現路徑完整呈現出來。Apps SDK是一套完整的開發堆疊,允許開發者在ChatGPT內部建構真實、可互動的應用程式。通過這套SDK,開發者可以連接自己的資料、觸發具體操作、並渲染出完全互動式的使用者介面。此前,Claude、GitHub Copilot等其他產品雖有工具使用能力,但只是將外部服務的結果以文字形式返回,缺乏真正的上下文理解和自然的互動介面。換言之,過去的工具難以真正被“用起來”,而OpenAI的Apps SDK讓使用者能在LLM中像在電腦上一樣使用App。現場展示了這樣一個案例:當使用者正在為寵物狗業務進行頭腦風暴時,可以直接“@”出Canva,它會立刻理解之前使用者和它聊到的所有點子,並根據“色彩豐富、異想天開”的模糊要求,生成一系列精美的海報。如果靈感迸發,使用者甚至可以要求它把其中一張海報直接擴展成一份完整的商業計畫書(Pitch Deck)。而當業務需要擴張時,ChatGPT會根據上下文建議使用者考慮“匹茲堡”這個城市,並無縫喚起Zillow應用,直接擴大到全螢幕,幫助尋找合適的房源,使用者只需要再在ChatGPT內提出新要求,就能讓它篩選出“帶院子的三居室”。接著,使用者還可以跟它繼續溝通,在ChatGPT裡問它諸如“這個房子離狗狗公園有多遠”之類的問題。這一系列操作行雲流水,背後展現的是Apps SDK將不同應用無縫融合的能力。使用者無需在不同軟體間切換,只需通過對話,就能在一個統一的入口中,讓最合適的工具在最恰當的時機出現,並協同完成一項複雜的任務。OpenAI發佈的重要進展是基於MCP,使開發者可以設計其應用的邏輯和介面。結合GPT本身對圖像的識別能力,它讓App更“自然”地融合在了對話過程中。因為對話和理解的便捷性,尤其是OpenAI在這場展示中著重強調的對上下文的記憶和理解,使用者可以很容易地在GPT中呼叫多種App去完成同一個工作。演示中有一段跨對話記憶的展示,ChatGPT在另一個對話中延續了上一個對話的話題這種強大的上下文理解能力,正是LLM有望成為主流軟體入口的核心競爭力之一。而App也不再是功能孤島,而是能被隨時喚醒、能充分理解對話背景的“外掛”,並以最合適的使用者介面融入當前的對話流中。使用者的主入口只有一個,就是ChatGPT的對話方塊。那如何讓App更好地適應使用者需求,和對話更好的連接,以推動萬物都在LLM內的大計呢?這就要靠這場發佈會的第二部分,AgentKit了。Agent時代來得太慢我們來推一把此前行業間普遍將2025 年稱作 “Agent元年”,可如今時間已行至10月,市場上卻始終未出現能復刻去年 Manus 那般、引發行業震盪的現象級Agent產品。OpenAI希望讓Agent時代來得更快,他們推出了號稱“最簡便、快捷”的Agent開發工具包——AgentKit。面對Dify、Coze等市場主流工具,OpenAI的答案是:讓一切回歸可視化。AgentKit的核心是一套可視化的畫布“Agent Builder”,開發者不再需要從零開始編寫程式碼,而是通過拖曳和連接不同的功能節點,比如檔案搜尋等,來直觀地設計和測試複雜的業務流程。此外,AgentKit還提供了名為“ChatKit”的可嵌入聊天元件,讓開發者能輕鬆地將具備品牌定製能力的聊天介面整合到自己的應用中。同時,它還有一個Connector功能,可以直接把Agentkit的Agent工具建構和企業內部資料和工具聯絡到一起。為了展示AgentKit的便捷性,產品經理Christina在現場僅用了8分鐘,從零開始為一個靜態的DevDay活動官網建構並上線了一個智能問答Agent。從演示中可以看到,AgentKit只有Agent、End(結束)、Note(筆記)三個功能節點,各個Agent間,可以用條件、同時進行和使用者許可三個邏輯點決定分叉走向。每個Agent中,可以使用檔案搜尋、安全防護和MCP應用這三個工具。也可以將他們作為功能點加在外部。目前看,這個AgentKit並沒有整體在設計邏輯上超越Dify類工具很多,但確實更精簡,更易用。但是,如果想讓習慣了Dify類使用者真正轉投OpenAI門下,還有兩個重要的原因:第一,是RFT(強化學習微調)的定製。第三方工具只能將GPT作為API“黑箱”呼叫,而AgentKit則能深入模型內部進行最佳化。目前,OpenAI已經開始實驗對GPT-5的RFT功能,開發者可以通過RFT來定製OpenAI的推理模型,還可以專門訓練模型,讓其學會在最恰當的時機、以最優的方式呼叫工具,從而實現更好的推理效果。這對於想用GPT作為基礎模型,達成最好的Agent效果的公司和開發者來講,是個巨大的優勢。第二,是AgentKit的Evals類股。它增加了“資料集建構”、“跟蹤評估”和“自動化提示最佳化”等能力,允許開發者對工作流進行端到端的評估,精準定位並修復問題。這對於Agent開發而言,確實十分便捷。今天的展示,不禁讓我想到了當年OpenAI發佈的Agentalpha版本,就是GPTStore的命運。當時,模型主要依賴上下文,無法有效呼叫工具和資料,導致應用場景受到很大限制。而當下,Agent面臨的一些具體落地問題,這個框架是否能夠解決還是疑問重重。但是,OpenAI已經開始做了,這些問題也許可以更快地找到解法。Codex,小露了未來程式設計的一手不論是開發Agent,還是部署App,最底層的都是程式設計。據Sam Altman介紹,自八月上線以來,Codex已經處理了40T的token,成為OpenAI增長最快的產品之一。從程式設計師社群的反饋來看,Codex的出現確實讓Claude一直以來的程式設計王者地位搖搖欲墜。本次發佈會中,Codex正式從研究預覽版轉為正式版(GA),其主要更新來自於對企業和工程團隊的深度支援,具體可以分為三個方面:首先是Slack整合。這是一個被社區呼籲已久的功能。現在,團隊可以直接在日常溝通的Slack頻道中呼叫Codex,讓它在對話流裡直接回答技術問題或編寫程式碼片段,無需切換應用 。其次是推出了全新的Codex SDK。這使得企業可以將Codex的能力作為模組,自動化並擴展到自己內部的開發工作流中 ,讓Codex能更好地融入企業現有開發體系。最後,OpenAI提供了一套新的後台管理與報告工具。這包括了環境控制、監控、分析儀表盤等一系列功能,讓企業的管理者能夠更好地追蹤和管理Codex在組織內的使用情況。但這些升級,遠不如現場最後的那段演示來得震撼。演示者Raman的目標是僅通過對話,讓現場的語音助手呼叫Codex SDK,命令它做一個滾動的開發者名單。Codex在後台即時修改了前端應用的React程式碼,螢幕上立刻開始滾動開發者的姓名。這個場景就是OpenAI預想的軟體開發的未來——你甚至不需要看到程式碼,軟體就可以在與你的對話中,即時地自我迭代和進化。API開放GPT-5 Pro、Sora 2全面上線除了上述三個構成全新生態的類股,發佈會第四部分是相對傳統的API更新。首先,OpenAI迄今為止最強大的模型GPT-5 Pro 正式通過API向所有開發者開放。其次,為了普及語音互動,OpenAI發佈了一款更小、更便宜的語音模型 GPT Real-time mini。它的成本比之前的版本降低了70%,但保留了同樣優秀的音質和情感表現力,無疑將大大降低開發者建構語音應用的門檻。而其中最重要的是Sora 2 API的開放。這意味著,開發者終於可以將OpenAI頂級的視訊生成能力,整合到自己的產品中。這個API的開放,表明未來在各種應用中,我們都可以方便地用上Sora 2來創作內容了。商業帝國的輪廓已經蓋住了AGI的圖景今年的旗艦模型GPT-5,儘管依舊強大,卻缺少了當初GPT-4發佈時那種跨時代的驚豔感,它更像是一次穩健但可預期的迭代。Sora 2的發佈也是如此,其真正的驚豔之處,並非視訊生成技術本身相較於早它發佈的Veo3等競品。而是其產品團隊精準洞察到了社交媒體的下一個爆點:將真實的人物無縫融入AI生成的視訊中。這是一個天才的產品構想,但它的光芒更多來自於商業嗅覺,而非底層的技術革命。此次 DevDay,正是這一趨勢的集中爆發。無論是試圖將所有應用納入對話方塊的 Apps SDK、旨在統一開發標準的 AgentKit,還是面向企業深度定製的 Codex,OpenAI 的每一步動作,都在朝著一條早已清晰的路徑深耕:搭建一個以自家大模型為絕對核心、封閉且極具掌控力的軟體生態。只是,我們分明能感受到,OpenAI 早年那種自帶的神秘感與對未知領域的探索氣質,正變得越來越淡;曾經讓人腎上腺素飆升的 “驚豔感”,似乎也在慢慢褪色。如今的 OpenAI,商業帝國的輪廓愈發清晰,甚至已經隱隱蓋住了通用人工智慧(AGI)的遠景圖景。 (騰訊科技)
馬斯克最新萬字演講-正在打造AI商業帝國,並沒放棄火星夢!
從政治漩渦抽身後,馬斯克的事業一直不太順,網上開始傳言說他要放棄火星夢。啥玩意?他要放棄了,那我這十年來的置頂算什麼?馬斯克當然不會放棄火星夢,而且他的AI商業帝國也在穩步向前。昨天,馬斯克在名為「X Takeover」的特斯拉粉絲活動做了訪談演講,他表示,未來特斯拉有望成為高達30億美元的商業帝國,核心是人形機器人、是AI,而非汽車。特斯拉只是馬斯克AI商業帝國裡的一環,這次訪談,馬斯克把自家所有公司的佈局都交代了下,我用大白話翻譯了下:這些公司的業務看起來相差十萬八千里,但其實馬斯克對自己的AI商業帝國有著閉環規劃和目標。他先是肯定了AI的顛覆性價值:“我從來沒見過任何一項技術,像AI 發展得這麼快。這不是進步,這就像一場'超音速海嘯'。”然後拋出了自己的核心觀點:AI將推動經濟進入豐裕時代,但三件事缺一不可——算力、能源和製造。第一步:算力先行(砸錢買"超級大腦")xAI正與金融方推進高達120億美元債務融資,用於採購NVIDIA晶片、建造新一代資料中心。簡單說就是:馬斯克要買20萬張最貴的顯示卡,建造世界最大的AI訓練營。目標不是讓AI陪你聊天,而是讓Grok真正"動手幹活",成為所有產品的"大腦"。第二步:能源保障(給"大腦"穩定供電)特斯拉2024年儲能部署達31.4 GWh,能源發電與儲能收入約101億美元,較去年同期成長+67%。這就像是給超級電腦配了一個不斷電的"超級行動電源",AI要24小時運轉,沒有穩定電力就是空談。第三步:製造落地(造出"萬能雙手")Optimus機器人要在2026年量產,目標是"五年內月產10萬台"。但這事也急不得,監管許可、技術迭代都比預期慢。這三步驟如果形成完美閉環會怎麼樣?按馬斯克的意思,"如果(算力、能源、製造)三大支點最終形成正反饋,所謂'近零邊際成本、總量無上限'的經濟模式,就不再是幻想"。啥意思呢?一旦AI、能源、製造這三樣東西互相促進形成良性循環,生產東西就會變得幾乎不花錢,想要多少就能創造多少!舉例來說:現在發個微信訊息幾乎不花錢,以後造實物也能這樣。3D列印一張椅子,主要是塑膠成本,其他都接近免費。用AI寫程式碼、機器人組裝汽車,人工費基本上為零。人類的終點不只是跟AI協作,而是透過腦機介面實現數字永生,透過AI科研走上火星!下圖是我用Claude做的馬斯克商業帝國全景圖,不得不誇這個生圖功能真是甩其他AI平台幾條街!人當然要有理想,我們發展AI也是為了讓更多人能有理想!馬斯克這次訪談裡明確地重申了自己的火星夢:「我們99%的努力都應該集中在地球上,但或許我們1%的努力應該用於成為一個太空文明和多行星物種。因為這有防禦性的理由,你知道,如果地球發生了什麼事摧毀了文明,這可能是第三次世界大戰,也可能是一顆像摧毀恐龍那樣的隕石。我們希望確保人類所擁有的這微弱的意識燭光不會熄滅。所以我認為成為一個多行星物種很重要,以確保意識以及地球上所有生命形式的長期存續。而且,你知道,其他生命形式無法自己延續到另一個星球,但我們可以為它們做到。 」馬斯克這話其實就是在講「數字永生與火星夢」。動真格的,馬斯克也說出了自己飛船的進度規劃:“希望飛船今年能成功回收,但可以肯定地說,明年上半年可以實現。”對一般人來說,馬斯克的終極目標其實就是讓《機器人總動員》變成現實,擺在我們面前的是要重新思考「生活」和「生存」的意思。馬斯克表示,未來不會缺乏資源,也不會缺乏服務,真正稀缺的,是人類的意義感。人類會從"勞動者"變成"創意者"和"目標設定者"。希望我們或我們的下一代,人人有理想。 🍺 (劉與白的AI乾貨舖)