上周,深度學習領域的標誌性人物吳恩達教授應邀在台灣發表了一場題為"AI, Agent and Application"的主題演講。作為斯坦福大學教授和 DeepLearning.AI 的創始人,吳恩達在人工智慧領域有著深遠的影響力。
他不僅在技術研究上碩果纍纍,更創辦了全球最具影響力的線上教育平台 Coursera,讓優質的 AI 教育資源得以走進千家萬戶。而他創立的 AI FUND,則專注於人工智慧領域的投資佈局,使他得以在產業實踐與學術前沿之間架起橋樑。正是這種跨界視角,讓他對 AI 技術的思考格外珍貴而深邃。
下面我會著重講述他的觀點,並且附上我個人的一些想法供參考交流
他首先提出了一個重要的觀點,即“AI 是一種新的電力”。
我的理解是,AI 是一種重要的資源,是一項通用的技術,將孕育出許多新的應用。過去我們說資料是一種新的生產力,基於資料的儲存,加工和計算誕生了當下許多國民級的應用。例如抖音,微信、Google等等。
但 AI 的出現加速了資料加工的過程,AI 能夠更好地理解結構化和非結構化的資料。AI 能夠高效地從資料中發現規律,學習知識,進而轉化為文字、圖片和視訊等媒介傳遞資訊,更可怕的是AI還可以做決策和使用工具。
緊接著他介紹了整個 AI 行業的結構。
AI 產業的發展如同一座冰山,有著清晰的層級結構。在最底層,是支撐整個產業的半導體基礎——以 GPU 為核心的計算硬體層。這個領域由輝達主導,AMD 和英特爾緊隨其後,他們不斷推動著算力提升與成本最佳化的邊界。
向上是雲端運算層,它讓算力資源變得觸手可及。越來越多的中小企業不再購置昂貴的物理裝置,而是轉向Google、亞馬遜、微軟 Azure 等雲服務提供商,通過靈活的按需付費模式來訓練和部署他們的模型。
浮出水面的是基礎大模型層,這裡是過去一年 AI 領域最耀眼的舞台。國際上有 OpenAI、Anthropic、Google、Meta 等領軍者,國內則有字節跳動、百度、阿里等科技巨頭,以及 KIMI、智譜、零一萬物、MiniMax、面壁智能、DeepSeek 等新銳力量爭相突圍。
這些通用大模型雖然能力全面,但往往難以在具體場景中做到極致,這既源於其普適性的定位,也受限於缺乏細分問題的專注度。
因此,在大模型之上,一個新的編排層應運而生。從最早的 Dify 和 Coze,到後來的 n8n、Wordware、CrewAI 等,這些平台提供了可視化的編排畫布,讓開發者能夠自如地設計工作流程,呼叫模型和外掛,實現複雜的邏輯控制,從而解決特定領域的實際問題。
最上層是應用層,它可以直接建構在模型層之上,也可以借助編排層來提升開發效率。這一層雖然技術門檻相對較低,但卻最接近實際價值創造,擁有最大的市場潛力和商業槓桿。若這裡無法創造出超越底層投入的價值,那麼整個產業鏈的資源投入都將失去意義。因此,應用層的創新與發展,正是檢驗整個 AI 產業成功與否的關鍵。
然後吳恩達介紹了他認為最具潛力的方向,Agents。Agents 就是多個智能體共同合作完成任務。
為什麼 Agent 的地位如此重要呢?首先 Agent 的誕生最早是源於思維鏈,尤其是反思思維鏈。
所謂反思思維鏈,就是讓模型在回答問題之前,先審視一下自己的答案,做一個評分,想想有那些可以改進的點,最後再輸出。
更進一步,如果 A 模型資料以後,不直接展示給使用者,而是讓 B 模型進行打分,想想有那些可以改進的點。然後讓 A 模型再改一版,再給 B 模型。如此循環幾次後,答案就會比直接輸出要好很多。
這個提升的幅度甚至比 GPT3.5 到 GPT4 還要大。
智能體不僅可以相互合作,智能體還能使用工具。比方說訪問網際網路,給一個環境執行程式碼,訪問資料庫,呼叫 API 等等。工具+工具,工具+模型的組合使得模型的能力進一步放大。
現在很多這樣的組合,比如說大模型生成畫圖提示詞,然後呼叫生圖 API,一張圖就水靈靈地出現了。
智能體還可以做到規劃,規劃就是把複雜的任務拆成一個個簡單的小任務,然後一個個解決。這個其實目前一些具備推理能力的大模型也可以做到,比如說 O1。但 Agent 之間的配合,如果搭配上能思考的大模型,起到的作用可能進一步放大。
最後可以再暢想一下。現實生活中,一個公司下面有不同的部門,每個部門有許多不同的角色,每個角色承擔著不同的任務。如果把角色換成 Agent,然後每個部門內多個 Agents 合作,最終部門之間的合作就是 Agents 之間的合作,一個人就是一家公司了。
除了 Agents,吳恩達更是指出了 AI 的五個發展趨勢,順著這些趨勢,可以去思考相關的機會。
在 AI 發展的不同維度,我萌生了一些深入思考:
首先,隨著 O1 等推理模型的出現,我意識到解決問題時不必過分計較 AI 當前的成本和速度。這些技術瓶頸必將隨時間推移而逐步突破,重要的是保持開放和想像的胸懷。
其次,技術進步正在加速個性化需求的精細滿足。在產品探索中,我們應該突破思維定式,不再拘泥於點子的大小,而是以開放、敏捷的姿態不斷鋪開,快速驗證,專注於解決一個又一個看似微小但實際意義重大的具體問題。
再者,圖像識別和分析正展現出令人驚嘆的廣闊前景。繼"胃之書"計算卡路里、AI 挑選榴蓮等創新應用之後,我們可以進一步想像:比如開發一款店舖人流分析工具。
傳統方案僅能通過物體識別檢測人數,而大模型則可以實現更精細的洞察——精準判斷顧客性別、推斷年齡層次、識別是家庭出遊還是情侶約會等。
第四個洞見關乎資料壁壘。過去,擁有大量使用者資料被視為核心競爭力。然而如今,資料遷移的成本相較計算開支已變得微不足道。
值得注意的是,OpenAI 的 token 費用遠高於資料傳輸成本。若某個平台能顯著降低資料分析計算成本,並提供卓越的計算能力,使用者遷移資料將不再是障礙。
最後,我們回到資料本身。AI 渴求大量優質資料,尤其是非結構化的內容——圖片、文字、音訊、視訊等。這些資料蘊含著巨大的訓練價值,但處理工程浩大。值得關注的是,已經出現了專門的公司致力於 OCR 等資料轉化,將非結構化資訊轉化為可用的問答資料。
新的合作範式也許是這樣的:
有一個想法
比如一家從事海運的傳統公司 MITSUI 認為 AI 可以通過查看全球航運、天氣、洋流等資料最佳化船舶航行的方式,提高燃油效率。
想法驗證(第 1 個月)
AI FUND 會用一個月的時間來研究一個想法,驗證市場並且證明技術可行性。
聘請 CEO(第 2 個月)
然後在市場上尋找合適的 CEO 人選,創立公司。並且和 AI FUND 一起驗證想法。
搭建核心團隊(第 3 個月)
創始人團隊需要在內建構初步技術原型,進行更加深度的市場調研和技術驗證。
執行落地(第一年)
AI FUND 會投資 100 萬美金作為前種子輪,來聘請關鍵執行層,打造 MVP,獲得初期的使用者反饋。
規模化放大(持續運轉)
如果順利的話,會攢一波 200-500 萬美金的種子輪,這時最開始的 MITSUI 會參投。並且它不需要僱傭和管理一隻 AI 團隊,通過合作和投資參與公司的建構,最終可以低成本地把技術應用的自己的業務中來。
在AI產品探索的道路上,我悟到了兩個至關重要的洞見。
首先,最富價值的創新往往源於真實業務場景中那些被忽視的具體需求。理想的產品孵化路徑是:從一個清晰、明確的痛點出發,與需求方緊密協作,共同精雕細琢,在實際業務環境中率先落地。
唯有深入到具體場景,才能真正理解問題的本質。當這個解決方案被驗證有效,且具備一定的行業普適性時,再將其提煉為標準化的產品對外銷售。這是一種自下而上的創新模式,確保了產品的實用性和市場價值。
其次,公司架構和激勵機制的設計至關重要,它們是創新文化的基石。
在項目伊始就精心設計組織架構和收益分配方案,不僅能最大限度地激發團隊的主動性,還能從根本上避免後續可能的利益紛爭。
一個科學合理的激勵體系,應當充分尊重每一位貢獻者,明確權責邊界,讓每個人都能清晰地看到自身的價值和發展空間。
這兩個維度共同構成了一個成功的AI產品孵化生態:以需求為導向的創新,配以合理的組織激勵機制。
以上是我對整個演講的闡述和理解,感興趣的朋友可以點選閱讀原文觀看演講視訊。 (豬欄守望者)