前沿：2024，AI即將面臨什麼

2024/01/29

•

《麻省理工科技評論》的「接下來是什麼」一期環顧了行業，趨勢和技術以求為您提供最新的未來視角。閱讀我們該期的剩餘內容（https://www.technologyreview.com/tag/whats-next-in-tech/）。

去年此時我們做了一些魯莽的事。在一個一切都在變化的行業，我們嘗試預測它的未來。

我們做了什麼呢？我們2023年四個大的預測（https://www.technologyreview.com/2022/12/23/1065852/whats-next-for-ai/）是聊天機器人的下一個重大事件可能是多模態（註：最強大的大語言模型， OpenAI的GPT-4以及谷歌DeepMind的Gemini，處理文本，圖像以及聲音）；執政者可能會制定嚴苛的新規定（註：拜登的行政命令將於10月發布）以及歐盟的AI法案在12月份獲得通過）；科技巨頭可能會感覺到來自開源創業公司的壓力（一半正確：開源的繁榮會持續下去，但是像OpenAI和谷歌DeepMind公司仍舊會處於核心地位）；以及AI可能會徹底改變大型製藥公司（太迅速以至於無法分辨：藥物發現領域的AI革命正如火如荼地進行著，但是第一批使用AI開發的藥物距離上市還要幾年時間）。

現在我們要再做一次預測。

我們決定忽略掉顯而易見的事實。我們知道大語言模型將會持續處於主導地位。監管機構會變得更加大膽。 AI的問題——從偏見到版權再到末日論——將會決定研究人員、監管機構和公眾的議程，不僅僅是在2024年，而是在未來幾年都是如此。

（生成式AI的六個大問題：https://www.technologyreview.com/2023/12/19/1084505/generative-ai-artificial-intelligence-bias-jobs-copyright-misinformation/）

此外，我們選了幾個更具體的趨勢。以下是2024需要注意的。（明年再來看看我們做得怎麼樣。）

1. 客製化聊天機器人

如果你得到了一個聊天機器人，你就得到了一個聊天機器人！ 2024年，重點投資生成式AI的科技公司將會處於證明他們可以從他們的產品中賺錢的壓力之下。為了實現這一目標，AI巨頭谷歌和OpenAI正在打賭做小事：他們都在開發用戶友好型平台，允許人們定制強大的語言模型，並製作自己的迷你聊天機器人，以迎合他們具體的需求— —不需要程式技巧。他們都發布了基於網路的工具，允許任何人都成為生成式AI 的App開發者。

在2024年，生成式AI可能會對監管者，非技術人員來說更有用，我們將會看到越來越多的人擺弄一百萬個小型AI模型。最先進的AI模型，例如GPT-4和Gemin，是多模態的，這意味著他們不僅可以加工文本，還可以加工圖片甚至影片。這項新的能力可能會解鎖完整的一系列新的APP。例如，房地產經紀人可以上傳以前房源的文本，微調一個強大的模型使其只需點擊一個按鈕就能生成類似的文本，上傳新房源的視頻和照片，就可以讓定制的AI生成對該房源的描述。

但是，當然這項計劃的成功取決於這些模型是否可信。語言模型經常編造一些東西，而生成模型則充滿了偏見。它們也很容易被駭客入侵，尤其是在允許它們瀏覽網頁的情況下。科技公司還沒有解決這些問題。當新鮮感消退後，他們將不得不為客戶提供解決這些問題的方法。

—Melissa Heikkilä

2. 生成式AI的第二波浪潮將是視頻

神奇的事物變得熟悉的速度之快令人驚訝。第一批產生逼真影像的生成模型在2022年成為主流，並很快變得司空見慣。 OpenAI的DALL-E、 Stability AI的Stable Diffusion和Adobe的Firefly等工具在網路上充斥著令人瞠目的圖片，從巴黎世家的教宗到獲獎的藝術作品。但也不是所有的事情都很有趣:每有一隻搖著絨球的哈巴狗，就有一個山寨的幻想藝術或性別歧視的刻板印象。

新前沿是文字轉視頻。希望它能把文字到圖像的所有優點、缺點或醜的方面都放大。

一年前，當我們訓練生成模型將多個靜態影像拼接成幾秒鐘長的片段時，我們第一次看到了生成模型可以做什麼。結果是扭曲和不穩定的。但這項技術已經迅速改進。

Runway是一家製作生成式視訊模型的新創公司（該公司與他人共同創建了Stable Diffusion），它每隔幾個月就會發布新版本的工具。它最近的模型，叫做Gen-2，仍舊在生成幾秒長的視頻，但是質量顯著。最好的影片已經與皮克斯推出的剪輯相差無幾。

Runway成立了一個年度AI電影節，展示由AI工具製作的實驗性的電影。今年影展有六萬美金的獎金，十部最佳電影將會在紐約和洛杉磯上映。

毫不奇怪，頂級工作室都注意到了這一點。電影巨頭，包括派拉蒙和迪士尼，現在都在探索生成式AI在其生產線上的用法。科技公司已經習慣為演員表演配上多種外語配音。它正在重新塑造特效的可能性。 2023年，《法櫃奇兵：命運之盤》的主演是個深度造假的Harrison Ford。這只是個開始。

在大螢幕之外，用於行銷或培訓的深度造假技術也在蓬勃發展。例如，UK的Synthesia製作了可以將演員一次性表演變成無限流的深度造假虛擬形象，只要按下按鈕，他們就會背誦你給他們的劇本。據該公司稱，目前44%的財富100強企業都在使用該公司的技術。

這種花小錢辦大事的能力對演員提出了嚴峻的問題。對電影公司使用和濫用AI的擔憂是去年SAG-AFTRA罷工的核心問題。但這項技術的真正影響才剛顯現。「電影製作的工藝正在發生根本性的變化，」獨立電影製作人、專門從事創意技術諮詢的公司Bell & Whistle的聯合創始人Souki Mehdaoui如是說。

—Will Douglas Heaven

3. AI產生的選舉假訊息將無所不在

如果最近的選舉可以作為參考的話，AI產生的選舉虛假資訊和深度造假將成為一個巨大的問題，因為2024年將有創紀錄的人數參加投票。我們已經看到政客將這些工具武器化。在阿根廷，兩名總統候選人製作了對手的AI圖像和影片來攻擊他們。在斯洛伐克，一位親歐洲的自由派政黨領袖威脅要提高啤酒價格，並拿兒童色情作品開玩笑的假照片在選舉期間迅速傳播開來。在美國，川普為一個利用AI生成帶有種族主義和性別歧視隱喻的表情包的組織歡呼。

雖然很難說這些例子對選舉結果有多大影響，但它們的擴散是一種令人擔憂的趨勢。在網上識別什麼是真實的將變得比以往任何時候都更加困難。在已經激化和兩極化的政治氣候下，這可能會產生嚴重後果。

就在幾年前創作一個深度偽造圖片可能需要前沿技術，但是生成式AI已經將其變得簡單到愚蠢和可行，並且輸出也越來越真實。甚至信譽良好的消息來源也可能被AI生成的內容所欺騙。例如，用戶提交的旨在描繪以色列-加薩危機的AI生成圖像已經淹沒了Adobe等圖片市場。

對於那些反對此類內容氾濫的人來說，未來一年將是關鍵一年。追蹤和緩解該類內容的技術仍處於開發的早期階段。水印，如GoogleDeepMind的SynthID，仍以自發為主，並不是完全萬無一失的。眾所周知，社群媒體平台刪除錯誤訊息的速度很慢。準備好迎接一場摧毀AI生成假新聞的大規模即時實驗吧。

—Melissa Heikkilä

4. 多工機器人

受當前生成式AI蓬勃發展背後的一些核心技術的啟發，機器人專家開始製造更多的通用機器人，這些機器人可以完成更廣泛的任務。

在過去的幾年裡，AI已經從使用多個小模型，每個小模型都被訓練來完成不同的任務——識別圖像、繪製圖像、給它們配上文字——轉向使用單一、整體的模型來完成所有這些事情，甚至更多。透過展示OpenAI的GPT-3幾個額外的例子（也叫作微調），研究者可以訓練它來解決程式設計問題，寫電影腳本，透過高中生物測驗等等。像GPT-4和GoogleDeepMind的Gemini這樣的多模態模型，既能解決視覺任務，也能解決語言任務。

同樣的方法也適用於機器人，所以沒有必要訓練一個機器人翻轉煎餅，另一個機器人開門:一個通用的模型可以讓機器人具備多任務處理的能力。 2023年出現了這一領域的幾個工作實例。

6月，DeepMind發布了Robocat(去年的Gato的更新版)，它透過反覆試驗產生自己的數據，學習如何控制許多不同的機械手臂(而不是一隻特定手臂，雖然這更典型)。

去年10月，該公司與33個大學實驗室合作，推出了另一款名為RT-X的通用機器人模型，以及一個新的大型通用訓練資料集。其他頂尖研究團隊，如加州大學柏克萊分校的RAIL(機器人AI和學習)，也正在研究類似的技術。

問題在於缺乏數據。生成式AI利用網路大小的文字和圖像資料集。相較之下，機器人幾乎沒有好的數據來源來幫助它們學習如何完成我們希望它們完成的許多工業或家庭任務。

紐約大學的Lerrel Pinto領導團隊來解決這個問題。他和他的同事正在開發一種技術，讓機器人透過試誤來學習，並在學習過程中產生自己的訓練資料。在一個更低調的項目中，平台招募了志願者，讓他們用安裝在拾荒者身上的iPhone攝影機收集他們家周圍的視訊資料。在過去的幾年裡，大公司也開始發布用於訓練機器人的大型資料集，例如Meta的Ego4D。

這種方法已經在無人駕駛汽車中顯示出前景。 Wayve、Waabi和Ghost等新創公司正在引領自動駕駛AI的新浪潮，它們使用單一大模型來控制車輛，而不是使用多個較小模型來控制特定的駕駛任務。這讓小公司趕上了像Cruise和Waymo這樣的巨頭。 Wayve目前正在倫敦狹窄而繁忙的街道上測試其無人駕駛汽車。世界各地的機器人發展都將以類似的方式往前推動。

作者：Melissa Heikkilä, Will Douglas Heaven

原文標題：

What's next for AI in 2024

原文連結：

https://www.technologyreview.com/2024/01/04/1086046/whats-next-for-ai-in-2024/