再次炸天的OpenAI，大模型生態初現

2023/11/11

•

不出意外地，OpenAI的首屆開發者大會，讓人特別意外。

一夜醒來，大模型圈一腳踏入了Agent的世界，另一隻腳則踏入GPT Store生態的河流中。

美東時間11月6日，OpenAI開發者大會正式開啟，創始人兼CEO山姆·奧特曼站在台上，45分鐘的密集輸出，再次展示了什麼叫「遙遙領先」。

我們先簡單回顧一下這場發表會的所有重點，其實無非就是三件事：

一是技術能力： GPT-4 Turbo升級了6大新能力，包括128K的上下文長度、更強的控制能力，模型的知識升級、多模態能力（語音和CV）、模型微調客製化和更高速率的限制，性能升級的同時，也對API呼叫的價格進行了下調；

二是可複製的能力：從原來的GPT到GPTs，用戶可以打造專屬於自己的GPT助手，企業可透過OpenAI提供的全套工具鏈「all tools」在企業內部建立有價值的工具，同時也可以深入讓GPTs進化成一個個Agents，為智能體做準備；

三則是生態能力：企業不僅可以打造GPTs，更能將其上架在市場內，即GPT Store，可分享給其他用戶使用，以及獲得分成，類App Store的商業生態由此為出發點。

正如網易有道CEO週楓所言，「這次模型上主要是性能和成本的優化，而在應用和生態方面，做了很多LangChain（開發工具鏈），LlamaIndex（開發數據框架）這些項目類似的工作，最終就是要實現以智能體作為AI App的願景。”

總之，OpenAI提供的生態能力解決了當下大模型發展的幾個重要困難點，而在此之上，大模型的應用層將迎來進一步爆發。

“很興奮，還有很多資訊在消化。”

OpenAI發布之後，光錐智能在與多位國內知名大模型創業者交流中，也感受到了大家對行業前景的期待，「OpenAI的多模態能力開放，對開發者是很大的利好，可以做的事情的邊界得到進一步拓展，我預計會有很多新的玩法出現。」月之暗面創始人楊植麟對光錐智能稱。

這45分鐘，為大模型火箭的二級爆發，再次添加燃料。

PART.0 1 讓大模型，飛入尋常百姓家

「有需求，打造生態，找落地。」OpenAI首屆開發者大會結束後，某家國內大模型明星公司CEO 對光錐智能發表了極為簡短，卻信息量極大的點評。

市場對ChatGPT的需求，無疑是巨大的。在發表會的開始，奧特曼報告了OpenAI 平台和產品的一些數據，截至目前，已經有大約200萬名開發人員在其API上建立各種各樣的應用，超過92%的全球500強企業正使用其產品，ChatGPT的周活躍用戶達到約一億。

自從GPT3.5問世到現在，每一次的升級都引領著大模型的下一個技術方向，不過，這次OpenAI GPT-4升級後的Turbo版本更像是查漏補缺。

首先是更長的上下文本長度，GPT-4Turbo上下文任務長度擴展至128K，相當於一本書的300多頁，是GPT-4支援的8K上下文的16倍。不僅如此，奧特曼還強調在擴展文字長度的同時，也應該保持模型的準確性。

其次是彌補OpenAI一直以來的短板－安全可控和知識庫更新速度。針對前者，推出了名為Json Mode的新功能，確保開發人員更容易呼叫API，提升對模型輸入和輸出的控制；即將推出「Copyright Shield」（版權保護）功能，若其企業和API用戶面臨版權侵權訴訟，OpenAI將為其承擔相應費用。針對後者，OpenAI平台支援使用者匯入文件、資料庫來更新大模型的認知，同時也將新升級後的GPT-4Turbo認知理解更新到了2023年4月。

最後，在此次更新中，OpenAI的多模態能力開放進入到了一個全新的階段。上一個時期，OpenAI花了一年多的時間，實現了ChatGP能說、能看、能聽，而現在才到了多模態能力釋放的節點。DALL-E3、文生語音模型TTS（text-to-speech）、Whisper V3都將以API的形式開放給開發者使用。

能力升級之後，為了讓更多的開發者用起來，還做了一個大降價。

奧特曼表示，不斷有開發者來向其抱怨，GPT-4定價太貴，也正是基於此，OpenAI這回乾脆來了個大模型降價促銷。

降價後的GPT-4Turbo輸入token價格是GPT-4的三分之一，輸出token價格是原來的二分之一；GPT-3.5Turbo 4K 精調版本輸入token價格是先前的三分之一，輸出token價格是原來的二分之一；GPT-3.5Turbo 16K精調版本輸入token價格是之前的四分之一。

正如奧特曼所言開發者的需求是驅動OpenAI降價的根本原因，這背後還有技術、商業等多重因素。

從技術降本看，根據外媒爆料，OpenAI這次可能將Stateless API變為Stateful API，奧特曼此前曾表示，基於Stateful API，用戶不用再“重複一遍一遍地為同樣的歷史對話付費”，理論上Stateful API形式可將大模型應用的開銷削減為原來的二十分之一。

在商業上，OpenAI也一直在尋找突破點，從API、ChatGPT個人版再到企業版，一直在探索商業化。但其對手卻未給喘息的機會，微軟、Salesforce、開源生態主導者Meta都在以更具性價比的方式，背後「偷襲」OpenAI，商業化的緊迫感與日俱增。

OpenAI降價的背後，也代表著國外大模型已經進入了普惠化、追求高性價比的新時期。

對新創公司、開發者而言是落地的機會，對OpenAI這類公司也是挑戰，由降價而帶來的或許是技術能力、資源分配、算力等多方面的挑戰。

“在綜合考慮後，我們優先考慮了價格，但速度卻不能同時兼得，這將是接下來研究的重點”，奧特曼道。

據多名使用GPT-4開發工具的技術人員稱，GPT-4速率限制已經開始加倍。

“算力應該還好，OpenAI儲備足夠多”，楊植麟對此發表了意見。

PART.02 為創業者提供「築夢」工具

光錐智能在與多位大模型創業者交流過程中發現，許多創業者不是缺乏好點子和創業想法，而是受困於數據、算力、工具、部署、訓練、推理等一個個的技術難題。

例如，知乎上一位基於大模型開發的對話解謎小遊戲的開發者，就因為遊戲用戶數量遠超預期，導致算力不足而被迫關閉了整個遊戲，留給玩家的只有一片遺憾和不捨。

同樣在中國國內，創業者們不是不知道Agent是未來的創業方向，而是心有餘力不足。一位Agent創業家告訴光錐智能，「資料清洗、長文本記憶、程式碼編寫、運行測試、部署落地、成本等等九九八十一難，關關難過，關關卡死每一個創業公司」。

據光錐智能了解，無論國內外，Agent離落地還差得很遠，目前比較確定的場景可能是Code Agent。原因在於，編碼本身就屬於大模型訓練推理和Agent執行任務的一環，距離最近，改造也越容易。

而現在，OpenAI發布的all tools工具、assistant API（助手API）則有希望讓上述這些問題迎刃而解。

assistant API 是OpenAI專為AI Agent開發者量身打造的工具助手，涵蓋了長線程（Threading）、知識庫（Retrieval) 、程式碼解釋器（Code interpreter）、函數呼叫（Function calling）幾項工具。

持久且無限長的線程，允許開發人員將線程狀態管理移交給OpenAI並解決上下文視窗約束；支援檢索功能，利用模型之外的知識來增強，例如專有領域資料、產品資訊或使用者提供的文件；支援程式碼解釋器功能，與ChatGPT Plus中一樣，可以在沙盒執行環境中編寫和運行Python程式碼，產生圖形和圖表，並處理具有多種資料和格式的檔案；函數呼叫功能也迎來更新，現在可以一次呼叫多個函數，並把回應合併到訊息輸出中。

總而言之，這些新功能精準切中了開發者們卡脖子的痛點，在OpenAI打造的全流程工具鏈上開發運行，將降低研發的門檻，縮短研發、測試週期，同時節省人力成本。

“我們對OpenAI又愛又恨，一方面它升級的工具有可能一瞬間讓我們的業務跑通，但另一方面，我們也得時刻警惕被OpenAI取而代之”，一位Agent創業家道。

讓我們聚焦在這次發表會的主角—「Agent」。奧特曼給Agent下的定義為，人們利用工具、AI來建立更個人化和客製化的分身，這些分身可以代表個人做很多事情。使用者只要詢問電腦所想要的東西，Agent分身就能替你完成所有任務。

光錐智能梳理OpenAI做Agent思路後發現，Agent不是憑空而來，一切都基於GPT的大模型，在大模型基礎上先是長出了GPT的分身“GPTs”，而後才是“AI Agent”。

「在OpenAI，我們一直篤定漸進的、迭代的部署是解決安全問題的最佳方式，即人工智慧的安全挑戰。我們認為謹慎對待面向未來Agent尤為重要，這需要大量的技術工作以及關於社會的深思熟慮，所以我們正在邁出通往未來的一小步——GPTs”，奧特曼表示道。

OpenAI通往未來Agent之路已初現雛形，正如其所言，“這還只是通往AI Agents邁出的第一步”，未來也許是多模態、多智能體。

PART.03 初建大模型生態

技術的迭代固然讓人興奮，工具的推出也讓開發者們更加方便快捷，但更重要的是，OpenAI憑藉著一己之力，讓大模型的商業化進一步落地。

早在今年5月，OpenAI開放插件系統後，首批上線了70個大模型相關的應用，包括猜詞、翻譯、查找股票數據等等工具，彼時便有人預測到，大模型的App Store來了，但後期應用逐漸增加，卻並沒有跑出「爆款級」應用。

有投資人認為：現在的GPT Store很像剛面世時的小程序，處於能力逐步補齊中，此次升級便是逐漸走向成熟的象徵，下一個微信或者抖音，很有可能在此誕生。

在此次發布會中，OpenAI重新梳理了應用商店的體系，小幅調整了頁面佈局，將ChatGPT變成了與第三方應用並列的應用層級，並將開發範圍擴大到了一個全新的範疇，按照奧特曼的說法，每一個GPT像是為ChatGPT的一個特殊目的，而量身訂做的版本。

但讓人更興奮的是，參考蘋果App Store，用戶可在GPT Store中搜尋下載GPT應用，商店也將推薦生產力、教育和好玩等類別的優質產品，OpenAI也明確了創建者可根據自有GPT的適用人數分成。這意味著，基於大模型的應用有了“容器”，開發者找到了買賣的“市場”。

舉個簡單的例子：大模型本身一塊塊地皮，工具箱是錘子釘子，不同的開發者將蓋不同房子，GPT Store則是一個房地產市場，也就是說，蓋出來房子不僅能自用，還能租出去和賣出去。

有了商業化的“交易場”，創業者們就有了正回饋，這使得創業不再只靠熱情和夢想，而是擁有了現實收益的可能性。

這或許也正是大模型創業者所言的“找落地”，上半年的AI創業離不開兩個字“燒錢”，5000萬的融資金額對大模型創業而言簡直是“滄海一瓢”，投資人不敢出手，創業者們也講不出新故事。

在現場，OpenAI的工作人員展示了OpenAI搭建的一款旅遊GPT的用法：它不僅能列出巴黎旅遊建議，還能在地圖上將計劃中提到的地點按類別標記起來，而這完全可以對用戶收費或進行會員制。

雖然，這並不代表每個登陸了GPT Store的應用程式都能賺錢，但至少有一個視窗可以獲得第一批種子用戶，從而反哺產品進步，形成成長飛輪。

參考行動互聯網應用爆發的年代，每個細分領域創業家都能挖掘出無數的需求形成應用，這或許也正是創業者們為之興奮的原因。

這時，才按下了所有APP重新做一次的啟動鍵。

“我們相信，AI會以一種前所未見的規模，予以個體和機構新的能力。這也將把整個人類提升到我們前所未見的規模”，奧特曼在結尾時提到。

顯然，OpenAI想做的，還有更多。基礎建設已經初步搭建完畢，剩下的，就是等時間和生態的其他角色，來開花結果。(光錐智能)

科技