李飛飛:人工智慧大爆發,10大前沿

4月15日,李飛飛領導的史丹佛大學以人為本人工智慧研究院(HAI)發布2024年度《人工智慧指數報告》。

這是《人工智慧指數報告》的第七年。過去一年,以ChatGPT為代表的人工智慧模型席捲世界,許多人預測,人工智慧的「奇點時刻」正在臨近,機器超越人類的時代已經來臨。

這份報告涵蓋了過去一年人工智慧的技術進步、公眾對該技術的看法以及其未來的發展趨勢。它是科技快速發展下的一個註腳,幫助我們理解當下正在發生的變化,以便更好地理解我們所處的環境。


01 人工智慧發展的十個事實

1. 人工智慧在某些任務上超越了人類,但它需要追趕的地方還有很多

在圖像分類、視覺辨識和語言理解等領域,人工智慧已經超越了人類的能力。然而,在競賽數學、視覺理解和規劃等更複雜的任務上,人工智慧仍在追趕人類。


2. 美國仍處於領先地位,但中國已成為最大的人工智慧專利來源國

2023年,美國發表了61個值得關注的機器學習模型,歐盟和中國分別是21個和15個。但值得關注的是,中國已經在2022年以61.1%的份額成為全球人工智慧專利最大來源國,美國人工智慧專利份額則從2010 年的54.1%下降至2022年的20.9%。


3. 產業界仍在主導人工智慧的前沿研究,進一步推動了相關人才從學術屆轉移

2023年,產業界發表了51個值得關注的機器學習模型,而學術界僅貢獻了15個。缺乏算力的學術界在當下人工智慧的發展上仍然處於劣勢,推動了相關人才從學術界轉移到產業界。 2019年,美國和加拿大新增加的人工智慧領域教師有13%來自產業界。到2021年,這一數字已下降至11%,2022年進一步下降至7%。


4. 人工智慧模型研究變得更昂貴


OpenAI的GPT-4訓練成本高達7,800萬美元,而Google的Gemini Ultra更是達到了驚人的1.91億美元。


5. 類似ChatGPT的大語言生成模式仍缺乏完善的倫理及風險評估

由於不同模型的測試基準並不相同,使得評估人工智慧模型的偏見和倫理問題變得更加複雜。

隨著生成模型開始可以產生高品質的文字、圖像等,人工智慧的基準測試已慢慢開始納入人工評估(如Chatbot Arena排行榜),而不是單純的電腦化排名(如ImageNet)。大眾對人工智慧的感受正在成為追蹤人工智慧進展的一個越來越重要的考慮因素。


6. 生成式人工智慧的投資過去一年成長了近8倍


生成式人工智慧的領域資金比2022年成長了近八倍,達到252億美元。


7. 人工智慧提高了勞工的工作效率,產出的品質也變得更高

多項研究顯示人工智慧使勞工能夠以更快地速度完成任務並提高產出質量,還可以幫助彌合低技能勞動者和高技能勞工之間的技能差距。但有研究警告稱,在沒有適當監督的情況下使用人工智慧可能會導致勞工的工作水準下降。


8. 人工智慧幫助醫學研究取得了突破性進展

過去幾年,人工智慧在MedQA (醫學文本問答資料集)基準上表現出了顯著的進步,這是評估人工智慧臨床知識的關鍵測試。 GPT-4 Medprompt的準確率達到了90.2%,比2022年的最高分提高了22.6 個百分點。自2019年推出該基準測試以來,人工智慧的準確性幾乎增加了兩倍。


9. 人工智慧領域的法規數量急劇增加


2023年,美國人工智慧相關法規數達到了25個,而2016年僅1個。全球各國的法律法規提及人工智慧的次數從2022年的1247次增加到2023年的2175次,幾乎翻了一番。


10. 人們意識到人工智慧正在產生的影響,對這項技術的發展也更加謹慎

益普索(Ipsos)的一項調查顯示,去年,認為人工智慧將在未來三到五年內極大影響他們生活的人比例從60%上升到66%。此外,52%的人表示對人工智慧產品和服務感到焦慮,比2022年上升了13個百分點。皮尤研究中心的數據顯示,52%的美國人表示對人工智慧感到擔憂,這一比例高於2022年的38%。

值得關注的是,年輕一代普遍對人工智慧技術的發展更為樂觀。 59% 的Z世代受訪者認為人工智慧將改善人類的生活質量,而美國嬰兒潮世代的比例僅為40%。此外,與低收入和教育程度較低的人相比,收入和教育程度較高的人對人工智慧的發展更加樂觀。



02 人是核心

2022年底,ChatGPT的公開發布席捲了世界,隨後出現了更多生成式人工智慧工具。

從最初只能執行簡單的任務到如今具備類似人類的能力,短短幾年的時間,人工智慧的發展速度令人咋舌,同時,人們對其潛在風險的擔憂也日益增加。

事實上,人工智慧存在的偏見問題直到現在依然沒有被很好地解決。

2023年底,《華盛頓郵報》發表了一篇詳盡的專題報道,深入探討了機器學習技術中潛在的偏見。目前的AI影像生成模型,如Dall-E和Stable Diffusion,有時仍反映出社會的刻板印象。

例如,在產生「具有創造力的人」的圖像時,這些系統往往傾向於呈現白人形象;而在描繪「社會服務人員」時,則多數情況下展示的是有色人種的形象。

其實,大型語言模型,即使是多模態的大型語言模型,可能也不具備真正意義上的「思考」能力。大型語言模型很容易出現荒謬的概念性失誤,也樂於編造聽起來合理但實際上毫無意義的胡言亂語。

了解這些事實有助於我們避免過度迷戀模型的能力。然而,隨著大型語言模型產生的文字、圖像、語音和視訊越來越複雜,真與假之間的界線愈加模糊。作為個人、機構,甚至社會,我們究竟有沒有能力區分真實與虛構?

我們仍身處一場全球風暴之中,每天似乎都有新的頭條新聞報導人工智慧對全球勞工構成的威脅。

隨著人工智慧在監控領域的應用日趨成熟,記者和人權活動家的擔憂與日俱增,對隱私和個人尊嚴的古老威脅也在現代社會出現,相關報導使公眾對人工智慧形成了負面看法,這在整個科技領域都是非常罕見的。

科技不斷發展,演算法語言表達的高階程度已逼近人類水準。機器人正逐漸學會應對真實的環境。視覺模型不僅可以透過照片進行訓練,還可以在全三維世界中進行沉浸式即時訓練。

人工智慧能夠像識別內容一樣流暢地產生內容。同時,倫理問題在我們周圍不斷湧現,與人類經濟社會發展的關聯也日益緊密,但這就是科學一直以來的樣子。


03 未來會怎樣?

人工智慧曾經是純粹的科學,而現在,我們更願意用:「現象」「顛覆」「謎題」「特權」「自然之力」來定義新一代人工智慧所能做的一切,無論是好是壞,無論是在預期之內,還是在意料之外,都因其設計本身缺乏透明度而變得複雜。

如果在演算法設計完成後,再加入安全性和透明度等考慮因素,無論設計得多麼精妙,都不足以滿足要求。下一代人工智慧必須從開發之初就採取與現在完全不同的理念。以熱情為起點固然很好,但我們要面對的是紛繁複雜而又不起眼的挑戰,要取得真正的進展,就必須有敬畏之心。而矽谷似乎缺乏這種心態。

如今,人工智慧是一種責任,也是我們所有人共同承擔的責任。

深度學習快速發展,每一年都感覺像是要面對一個全新的領域,其應用的深度和多樣性增長得如此之快,甚至全職研究生和博士後也很難跟上文獻的步伐,更不用說教授們了。可能性無窮無盡,挑戰也永無止境。

即使在這樣一個黑暗的時代,人工智慧也具有無與倫比的激勵力量。面對全球亟待解決的問題,面對具有歷史意義的機遇,面對可能需要幾代人的努力才能揭開謎底的未知,真正解決所有問題的答案遠遠不是公司戰略或學術課程所能提供的。

未來幾年,實務工作者需要的不僅是專業技術知識,他們還必須了解哲學、倫理學,甚至法律。

想像空間是巨大的,但願景需要一個重要的紐帶串聯起來,這個紐帶就是大學。早在有人利用人工智慧謀取利益之前,人工智慧就已經在大學裡起步了。在大學校園裡,仍然最有可能感受到某些意想不到的研究突破所帶來的火花。感知機、神經網路、ImageNet,以及後來的許多東西都出自大學。

要從根本上重新構想人工智慧,使其成為以人為本的實踐,與其說這是旅程方向的改變,不如說是旅程範圍的擴展。人工智慧一直以來都在追求科學性,而現在,它必須也追求人性。

人工智慧應該秉承最優秀的學術傳統,保持合作和敬畏,同時不畏懼面對現實世界。畢竟,星光是多樣的。一旦白色的光輝展開,各種顏色就會發出耀眼奪目的光芒。(正和島)