生成式AI揭開“第二幕”
前言
六十多年摩爾定律的積累,讓我們擁有了處理大量資料的能力;
網路四十年的沉澱,為我們提供了價值連城的訓練資料;
二十年的行動和雲端運算發展,讓超級電腦觸手可及。
簡而言之,幾十年的技術進步,為生成式AI的起飛創造了必要的條件。
生成式AI的「第一幕」來自科技推動。
我們發現了一種新的「錘子」——基礎模型,並釋放了一波新奇的應用,這些應用是新技術的輕量級演示。
儘管這些早期的成功跡像不容忽視,但許多AI公司仍然沒有找到產品市場契合點或可持續的競爭優勢,AI生態系統的整體繁榮是不可持續的。
現在我們認為是時候放眼長遠,反思生成式AI——我們今天的位置,以及我們可能的發展方向。
我們相信市場現在正在進入“第二幕”
生成式AI:第二幕
第二幕AI應用將端到端解決人類問題。與第一批AI應用的性質不同,更傾向於將基礎模型作為更全面解決方案的一部分,而不是整個解決方案。
AI應用正在透過引入創新的編輯介面,提升使用者的工作效率和體驗。這些介面不僅增加了用戶與應用之間的“黏性”,還顯著提高了輸出結果的品質。而且往往能夠處理多種類型的資料輸入和輸出,也就是所謂的多模態。
人工智慧市場地圖
我們更新了人工智慧市場地圖,主要反映了市場的兩個重要推動力:生成式人工智慧從技術錘子演變為實際用例和價值,以及生成式人工智慧應用日益多模態的性質。
此外,我們也新增了一套大型語言模型(LLM)的開發工具包,它展示了企業在開發實際可用的生成式AI應用時,所選擇使用的運算資源和軟體工具。
我們現在處於什麼位置?
生成式人工智慧的價值問題
生成式人工智慧(Generative AI)的應用場景和市場需求是顯而易見的。使用者們迫切希望人工智慧技術能簡化他們的工作流程,並提升工作成果的品質。
正因如此,儘管這些應用程式還沒有廣泛普及,用戶們還是以前所未有的速度蜂擁而至,爭相體驗這些應用程式。
但人們會留下來嗎?
結果並沒有那麼樂觀。
下圖比較了人工智慧優先應用程式與現有公司的第一個月行動應用程式保留率。
使用者黏性相對較低
在使用者黏性的賽場上,頂尖消費品公司以60-65%的DAU/MAU比率穩坐C位,WhatsApp更是以85%的高分獨領風騷。
然而,生成式AI應用卻以14%的比率默默退居二線(角色扮演和「AI陪伴」除外),似乎被用戶打入了「冷宮」。
這意味著用戶還沒有發現生成式人工智慧產品有足夠的價值吸引自己每天使用它們。
簡而言之,生成式人工智慧最大的問題不是找到用例、需求或分佈,而是證明價值。
就像我們的同事David Cahn所指出的:我們該如何利用這些基礎設施?它將如何真正改變我們的生活?
要建立一個持久的業務,關鍵在於解決用戶留存問題,並為客戶創造足夠深刻的價值,讓他們成為AI的忠實擁躉和日常活躍用戶。
第二幕:共享
生成式AI領域,企業們正在共同探索並逐漸形成一套業界廣泛認可的方法和實踐,以推動AI技術的成熟和應用的廣泛性。
創業者們正投身於艱苦的工作——提示工程、微調優化和數據集策劃,以使他們的AI產品變得出色。他們正一步步將酷炫的演示轉變為落地的產品。同時,基礎模型底層也不斷湧現研究與創新。
模型開發堆疊
推理技術
鍊式思考(chain-of-thought)、思考樹(Tree-of-thought)和反思(reflexion)等新興推理技術正在提升模型執行更豐富、更複雜推理任務的能力,縮小了客戶期望與模型能力之間的差距。開發者使用Langchain等框架來呼叫和調試更複雜的多鏈序列。
遷移學習技術
隨著GPT-3.5和Llama-2/3等模型微調技術開放,RLHF和微調變得更易用,意味著公司可以將其基礎模型適應於特定領域,並透過使用者回饋進行改進。開發者從Hugging Face下載開源模型並進行微調,以實現優質效能。
檢索增強生成
引入了關於業務或用戶的上下文,減少了幻覺,提高了真實性和實用性。像Pinecone這樣的向量資料庫公司已成為RAG的基礎設施支柱。
新開發者工具與應用框架
為公司提供了可重複使用的構建塊,以創建更先進的AI應用,並幫助開發者評估、改進和監控生產中AI模型的性能,包括LLMOps工具,如Langsmith和Weights & Biases。
AI優先基礎建設公司
Coreweave、Lambda Labs、Foundry、Replicate和Modal等公司正在拆解公有雲,並提供AI公司最需要的:充足的GPU、合理的成本、按需可用和高度可擴展,以及優質的PaaS開發者體驗。
這些技術共同應該能夠縮小模型的期望與現實之間的差距,而底層的基礎模型也同時改進。
但使模型變得優秀只是征程的一半。生成式AI的使用者體驗也不斷升級:
新興產品藍圖
生成式介面
基於文字的會話使用者體驗是LLM之上的預設介面。逐漸地,新的產品形態正在進入我們的武器庫,從Perplexity的生成式使用者介面到Inflection AI的類似人類聲音的新模態。
新的編輯體驗
從Copilot到導演模式。隨著我們從zero-shot到詢問和調整,生成式AI公司正在發明一套新的“旋鈕”和“開關”,這些看起來與傳統的編輯工作流程非常不同。
Midjourney的新平移指令和Runway的導演模式創造了新的類似相機的編輯體驗。 Eleven Labs透過提示使操縱聲音成為可能。
癒加複雜的代理系統
生成式AI應用現在不僅僅是自動完成或人類審查的初稿;它們現在具有自主解決問題、存取外部工具並代表我們端到端解決問題的能力。正從L0級的嬰兒步態,穩定成長,朝向L5級的全自主能力邁進。
系統範圍優化
一些公司沒有嵌入到單一使用者的工作流程中使該個體更有高效,而是從更宏觀的角度出發,對整個系統進行最佳化。
設想一下,AI不僅僅是個人助理,而是系統優化的大師。它能夠一眼辨識出堆積如山的工作任務中哪些是最緊急、最重要的。然後,不需要你指揮,自己就能動手解決這些問題,讓整個團隊的工作流程變得絲滑無比。
結論:AI的“成長之路”
隨著我們逐步深入探索的前沿悖論,以及對變換器(transformers)和擴散模型(diffusion models)的新鮮感逐漸消退,生成式AI市場的本質正在演變。那些炒作和噱頭正逐漸謝幕,而真正能夠提供價值和卓越產品體驗的AI應用逐漸走入聚光燈下。
我們對生成式AI的信念堅定不移。這個市場起飛的必要條件已經累積了數十年,現在市場終於成熟了。殺手級應用的出現和終端用戶需求的巨大規模加深了我們對市場的信念。
然而,阿瑪拉定律(Amara's Law):我們傾向於高估科技在短期內的影響,而低估其長期的影響-正在發揮作用。我們在投資決策中保持耐心和判斷力,密切關注創辦人是如何解決價值問題的。
擁抱AI的公司們正在探索多種方案,以推動模型性能和產品體驗的不斷向前,這讓我們對生成式AI的第二幕充滿樂觀。(AI Pioneer)
原文連結:https://www.sequoiacap.com/article/generative-ai-act-two