ChatGPT倒逼革新，搜索引擎生態不穩

2023/02/21

•

ChatGPT來勢洶洶，席捲科技文化各個領域，現在又觸發微軟和谷歌緊急革新，紛紛承諾旗下的搜索引擎都會採用人工智能來抓取網頁，檢索和呈現內容，並直接生成用戶問題的答案——就像ChatGPT一樣。微軟稱其將打造出一個新必應，並正在其Edge瀏覽器中構建相關功能，谷歌也計劃在未來幾週內久推出新項目Bard。

微軟將這一變革定義為一種新的技術生態，與當年進入圖形用戶界面或智能手機的事件具有同等歷史意義，有可能重塑現代科技的格局，將谷歌趕下搜索引擎的霸主地位。但每一個新的科技時代都會帶來新的問題，本文將分析AI驅動的搜索引擎在未來需要警醒的7個問題——從一個勁瞎掰到掀起文化戰爭，再到終結廣告營收。

搜索引擎必應已經展示了其AI新範式：詢問新聞並用自然語言接收。圖片來源：The Verge

問題1：智能助手還是瞎掰神器？

毋庸置疑，作為支撐這些AI的核心技術，大型語言模型（LLM）會生成大量的廢話，這是所有AI驅動的搜索引擎會面臨的最大的問題，也是為什麼有些人認為它們根本不適合去執行當前的書寫任務，比如被炒作的AI學術論文，以及回答諸如「10公斤鐵和10公斤棉花哪個更重」之類的簡單問題。

這些錯誤的範圍和嚴重程度各不相同，許多簡單的錯誤很容易糾正。但另一些人已經指出互聯網上已經充斥著當前搜索引擎檢索到的有毒信息垃圾，我們還不能保證能完全消除這些瞎掰出來的錯誤，也沒有可靠的方法來跟踪它們發生的頻率。

問題2：「真正的答案」靠譜嗎？

瞎掰廢話本身就是AI的劣根性，但AI被默認會給出「一個真正的答案」更是加劇了一個質疑——搜索引擎所提供的答案太過於單一和明確，並非正確的答案。而這種默認給出「真正的答案」一直也是搜索引擎存在的問題，十多年前谷歌開始提供「片段」（Snippets），這些盒子出現在搜索結果上方，犯了各種令人尷尬和原則上的錯誤：從錯誤地將美國總統命名為KKK成員，到建議患有癲癇的人應該躺在地板上（該答案與正確的醫療程序完全相反）。也就是說，AI驅動的聊天機器人進入搜索引擎後，會加重這個問題的嚴重性。

不僅是因為聊天機器人會傾向於提供獨特的答案，而且答案的權威性也會因AI的神秘性而增強——AI的答案來自多個來源，但通常沒有適當的歸因。當然，有一些功能可以緩解這些問題，比如必應的人工智能界面為其來源提供了腳註。谷歌強調，它的人工智能所參與回答的問題將嘗試一種稱為NORA的原則，即「沒有一個真正的答案」。

必應Bing犯了「真正的答案」錯誤。它引用的消息來源是關於煮沸嬰兒奶瓶的，但用戶搜索的問題是：煮沸嬰兒安全嗎？。圖片來源：The Verge

問題3：越獄AI執行有害任務

雖然上述問題對所有用戶來說都是問題，但也有一部分人會嘗試破解聊天機器人以生成有害內容。這一過程被稱為「越獄」，並且可以在沒有傳統編碼技能的情況下完成。用戶可以使用多種方法破解AI聊天機器人，一旦官方系統的防護措施失效，惡意用戶就可以使用AI聊天機器人執行各種有害任務，比如生成虛假信息和垃圾郵件，或者就如何攻擊學校或醫院、製造炸彈或編寫惡意軟件提供建議。

問題4：文化戰爭和偏見埋伏已久

隨著ChatGPT的推出，人們已經看到了所謂的人工智能文化戰爭的開始。激進的出版物和有影響力的人指責聊天機器人學會了政治正確，拒絕回應某些提示或做出種族歧視的表達。例如，在印度，OpenAI被指控有反印度教偏見，因為ChatGPT不會輸出穆罕默德或耶穌的笑話。由於歐盟和美國的政客們擅長利用科技的力量來進行權力博弈，人工智能對意識形態的偏見和影響可能會很快引起爭議。

問題5：白白燒錢的遊戲？

運行人工智能聊天機器人的成本比傳統搜索引擎高許多。首先，是訓練模型的成本，每一次迭代的成本可能高達幾十，甚至上億美元，這就是為什麼微軟一直在向OpenAI投入數十億美元的原因。然後，還有推理的成本，或者說產生每一個響應的成本。OpenAI使用其最強大的語言模型生成大約750個單詞，需要開發者支付2美分（約合人民幣13元）。

這些數字如何轉化為企業定價或與常規搜索進行比較尚不清楚。此外，為了與競爭對手較量，搜索引擎之間會大量燒錢去擠占對方市場，就微軟而言，燒錢傷害對手似乎是當前的目標，公司認為要拿下搜索引擎這樣一個利潤豐厚的市場，錢不是問題。

問題6：法規還是老問題

法律雖然是AI的老頭疼項目，人工智能搜索引擎和聊天機器人有更多可能違反因內容生產而帶來的付費方面法律難題。例如，歐盟出版商是否會希望人工智能搜索引擎像谷歌現在為新聞片段付費一樣，為他們的內容付費？如果谷歌和微軟的聊天機器人正在重寫內容，那麼它們是否仍然受到美國相關條例的保護，以防止它們對他人的原創內容承擔責任？

此外，工智能搜索引擎還涉及到隱私法和被遺忘權。意大利最近禁止了一個名為Replika的AI聊天機器人，因為它正在收集未成年人的信息。ChatGPT和其他公司也在做同樣的事情。微軟和谷歌還需要解決技術，去確保他們的AI不會抓取已被下架的信息源，防止其語言模型納入被他方禁止信息。

問題7：失去大量廣告收入

人工智能的搜索引擎產品對網絡媒體生態產生的最直接影響在於，如果AI搜索引擎從各家網站上獲取答案，但不將搜索和閱讀流量推回到這些網站的話，網站可能將失去廣告收入。如果他們失去了廣告收入，這些網站就極大可能會消亡。如果他們死了，就沒有新的信息來供給人工智能。這似乎會帶來網絡信息產業的終結。微軟辯稱，它所引用的信息來源，用戶只需點擊即可閱讀更多內容。但這些新AI搜索引擎顯然會比舊搜索引擎更智慧，消除了用戶閱讀更多內容的需求。（傳媒1號）