假如在一到兩年內,一款真正意義上的AGI能夠進入市場,你會期待它能做哪些事呢?最近,OpenAI的共同創辦人兼首席架構師約翰舒爾曼(John Schulman)在一次訪談中分享了他對AI模型未來發展的看法。在他眼中,AGI的實現近在咫尺,人們將在三到五年內見證人工智慧的飛躍式發展。真正意義上的AGI將在這個期間問世。圍繞著這個預測,舒爾曼深入探討了關於大模型訓練的現狀、相關技術的進化方向以及未來AI需要面對的監管問題。這100分鐘的訪談乾貨滿滿,讓我們一起來看看舒爾曼眼中的AI模型會走向怎樣的未來。
舒爾曼首先討論了AI在未來人類社會中的定位。他認為,AI始終是人類的助手,而相關的技術也會朝著讓AI成為更優秀助手的方向發展。舒爾曼解釋道,所謂的AI訓練,就是對已經從互聯網中抓取了足夠內容的模型進行針對性的行為優化,以滿足人類的需求。經過訓練的模型可以非常精確地產生內容,並按照要求排列內容的分佈,從而實現特定的功能。他期望在不久的將來,AI能夠更像一個樂於助人的同事,而不僅僅是一個執行一次性查詢的工具。
舒爾曼希望AI能夠更加主動,理解並參與用戶的整個專案中,甚至能夠主動提出建議和幫助。他預見到AI既可以充當你的私人秘書,也可以做你的程式設計師,但所有這些功能都是建立在人類的要求上。因此,AI始終都是人類的僕人,而非人類的主人。目前的模型只是試圖產生一些人們會喜歡並且判斷為正確的東西,而不關心產出的內容。在此基礎上,舒爾曼預測在未來的五年內,AI模型將向著「更好的助手」進化,他希望AI能夠獨立完成整個程式設計專案。
根據人類的要求自行編寫程式碼,而不僅僅是提供編寫函數的建議,是舒爾曼對AI模型進化的期望。同時,AI在執行多執行緒與長時間任務上的能力也將大幅提高,最終實現長時間編寫多個程式碼檔案的目標。在一系列進步下,模型將變得更有效率,可以更快地從錯誤中恢復,更好地處理臨界情況。
舒爾曼也希望能為AI模型增加新的任務模式,透過預訓練和後訓練的結合,不斷改進功能,開拓新的用例。他預計,隨著時間的推移,人工智慧將成為經濟的重要組成部分,人們將更好地理解如何將其整合到不同的社會活動中。舒爾曼的這些觀點展示了未來AI模型在功能上的廣泛潛力和應用情境。
舒爾曼在訪談中詳細介紹了強化學習在提升AI模型品質中的作用。他認為,透過長期進行強化學習訓練,AI可以在更長時間裡保持連貫性,達到人類層面的任務處理能力。舒爾曼將這種質的變化稱為「相變」。一旦模型的規模與學習訓練達到某個水平,就能夠處理更長的任務。透過使用特定的提示語,人類可以向AI描述任務所需的時間尺度,然後AI就可以開始製定學習計劃,無論這個目標是一個月還是十年後。
OpenAI目前的研究專注於基於人類回饋的強化學習(RLHF)系統。在RLHF中,AI表現出了類似人類的心理驅動力,即對目標的渴望。舒爾曼解釋說,當人類有了某個特定的目標時,會進入「尋找食物」的狀態,AI也會表現為對人類正回饋的追求。舒爾曼認為,這種驅力和目標概念是實現AGI的重要因素,能夠讓AI以有意義的方式實現與人類相同的心理模式。
舒爾曼坦率地承認,目前的AI技術存在著多種瓶頸,但他對這些挑戰抱持樂觀態度。首先,AI模型難以預測的雜項缺陷是一個主要問題。一旦開始進行長期的密集學習訓練,模型在更長時間內保持連貫能力可能會導致它們經過強的學習訓練,從而陷入瓶頸。此外,當下AI模型的局限性,包括未完全摸清AI這個“灰盒子”,也會導致意料之外的問題,如模型錯誤地認為自己可以執行某些任務。
舒爾曼認為,解決這些問題的方法是透過強力學習訓練,使模型能夠在兩到三年內克服這些瓶頸,迎來人工智慧發展的新高峰。其次,訓練資料不足也是一個挑戰。儘管網路知識浩如煙海,但對於高速吞吐資料的語言模型來說,網路中的可供學習資料遠遠趕不上它們的消耗速度。然而,舒爾曼認為數據不足的問題被誇大了,透過少量範例也可以改善AI的性能。大模型能夠從少量資料中提取所需功能,這意味著準確識別需要的功能和收集相關資料比單純增加訓練資料更為重要。
隨著AGI的逐步實現,舒爾曼強調了AI監管的重要性。他指出,政府需要製定安全處理AI的解決方案,以應對潛在的失業潮、道德倫理風險和資訊安全隱患。舒爾曼建議,社會需要一套強大的監管系統與穩定的社會實驗,逐步部署AI模型並不斷升級效能,以便在出現任何意外事件時隨時終止部署過程。
舒爾曼也指出,儘管AI營運的公司在許多方面可能表現出更高的效率,但也存在更高的尾部風險,即在處理非常少見的情況時更可能出現大規模故障。因此,他不建議大規模將AI投入公司管理。然而,舒爾曼並不否定AI公司的可能性,他認為當社會準備好,AI在管理上證明自己比人類更善於對人類負責時,讓AI管理公司是可以被接受的。
舒爾曼也給了中小企業和個人開發者一些技術建議。他認為,與其他領域相比,機器學習是一個相對健康的領域,因為它足夠“務實”,整個領域基於技術的實用性和實證主義。只要能做出成果,就能獲得回報。因此,他推薦有志於此的個人和企業投入這個領域來展現才華。
舒爾曼指出,訓練一個具備所有功能的模式是相當複雜的,需要大量專業人士和研發累積。他建議那些缺乏經驗和人手的企業可以考慮使用「蒸餾」模型來建立自己的AI系統。透過將複雜且規模較大的教師模型中的知識提取出來並傳遞給相對較小的學生模型,可以在保留模型性能的前提下減少模型的複雜度,使其易於部署和運行。
舒爾曼對未來AGI發展的展望讓我們看到了科技的無限可能,同時也讓我們思考人類社會是否準備好迎接AGI的到來。身為「AI焦點」公眾號的主編,我希望與廣大粉絲一起探討這些前沿話題,分享對未來的看法和期待。如果你有任何關於AGI或AI發展的見解或疑問,歡迎在評論區留言,讓我們一起為未來的AI時代做好準備。(AI焦點)