《財富》封面:全球爆紅的ChatGPT是如何誕生的?

在一代人的時間裡,總是會出現一些產品,將從工程部門昏暗的地下室裡,青少年書呆子氣味難聞的臥室裡,或者孤僻的有某種嗜好的人家中誕生的技術,變成人人都會用的工具。網絡瀏覽器誕生於1990年,但直到1994年網景導航者(Netscape Navigator)問世,大多數人才開始探索互聯網。2001年iPod誕生之前流行的MP3播放器,並未掀起數字音樂革命。同樣,2007年,蘋果(Apple)iPhone手機橫空出世之前,智能手機已經問世,但卻並沒有針對智能手機開發的應用。

2022年11月30日,人工智能領域可能也迎來了與網景導航者的問世同樣重要的關鍵時刻。

ChatGPT的橫空出世,在人工智能領域掀起了重要變革,這一智能工具因其解放人類生產力的潛力,從使用者到投資者,引起了各界的廣泛關注。1月30日,有消息稱,百度將於3月在中國推出類似ChatGPT的人工智能聊天機器人程序。隨著微軟、百度等巨頭加碼,AIGC(人工智能自動生成內容)領域或將成為2023年最值得關注的、全球最熱門賽道。儘管ChatGPT乃至整個行業距離真正成熟的商業化仍有差距,從ChatGPT的幕後故事中,我們仍然得以一窺它會如何影響科技、商業以及人類社會的發展進程。


舊金山人工智能公司OpenAI的首席執行官山姆·阿爾特曼宣告了這個時刻的來臨。OpenAI成立於2015年,得到了埃隆·馬斯克、彼得·泰爾和其他PayPal幫成員以及LinkedIn聯合創始人雷德·霍夫曼等一眾矽谷大佬的投資。11月30日,公司成立約7年後,阿爾特曼發推文稱:“今天我們發布了ChatGPT。歡迎點擊這裡與它聊天。”任何人可以通過推文中的鏈接註冊一個賬號,開始與OpenAI的新聊天機器人免費聊天。

這引起了各界人士的興趣。人們不止與它交流天氣狀況。它根據軟件公司CEO和工程師阿姆賈德·馬薩德的要求,檢查了程序代碼的漏洞。美食博主和網紅吉娜·霍摩爾卡要求它編寫一份健康的巧克力片曲奇餅乾食譜。Scale AI公司的工程師賴利·古德賽德要求它撰寫一集《宋飛傳》(Seinfeld)的劇本。市場營銷人員、一家在線人工智能美術館的經營者蓋伊·帕森斯要求它為其撰寫提示語,然後輸入到另外一款人工智能係統Midjourney後轉換成圖像。斯坦福大學醫學院(Stanford University School of Medicine)的皮膚病學家、從事人工智能醫學應用研究的羅克珊娜·丹妮休向它提出了醫學問題。許多學生利用它完成家庭作業。這一切都發生在該聊天機器人發布後24小時內。

以前也曾有其他聊天機器人,但沒有一款能與ChatGPT相提並論。ChatGPT能進行天馬行空的長對話,可以回答問題,還能根據人們的要求撰寫各種書面材料,例如商業計劃書、廣告宣傳材料、詩歌、笑話、計算機代碼和電影劇本等。當然,它並不完美:它提供的結果往往不夠準確;它無法引用信息來源;而且它幾乎完全不知道2021年以後發生的事情。雖然它提供的結果通常足夠流暢,在高中甚至大學課堂上可以過關,但根本無法像人類專家們的表述那樣做到字斟句酌。另一方面,通常在對用戶知之甚少的情況下,ChatGPT生成內容只要大約一秒鐘時間,而且它生成的許多內容並沒有想像的那麼糟糕。ChatGPT發布五天內,該聊天機器人的用戶就超過了100萬人,而Facebook用了10個月時間才達到這個里程碑。

過去十年,人工智能技術在商業領域逐步擴大應用,悄然改進了我們日常使用的許多軟件,但卻並沒有令非技術用戶感到興奮。ChatGPT的橫空出世改變了這一點。突然之間,人人都開始談論人工智能將會如何顛覆他們的工作、公司、學校和生活。

ChatGPT是一股相關人工智能技術浪潮的一部分,這種技術被統稱為“生成式人工智能”,還囊括了Midjourney和Lensa等熱門藝術生成模型。OpenAI位於科技行業“下一個大事件”的前沿,它具備了一家傳奇初創公司的特徵,包括全明星級別的團隊和投資者的熱捧,該公司的估值據稱已經達到290億美元。

該公司最近的突然躥紅引發了嫉妒、猜疑和恐慌。谷歌(Google)利潤豐厚的搜索帝國可能受到影響。據媒體報導,為了應對ChatGPT,谷歌內部已經拉響了“紅色警報”。但OpenAI能成為超強科技公司俱樂部的成員,出乎人們的意料。幾年前,它甚至還不是一家公司,而是一家致力於學術研究的小型非營利性實驗室。公司至今依舊秉持著崇高的創立原則,例如保護人類文明,防範不受限制的人工智能所帶來的威脅等。與此同時,OpenAI經歷了一次內部轉型,導致原始團隊分裂,公司也將重心從純科研項目逐步轉移到商業項目。(有批評者認為,發布ChatGPT本身是一種危險行為,並且表明OpenAI的經營模式發生了巨大轉變。)

圖片來源:IAN C. BATES—THE NEW YORK TIMES/REDUX

OpenAI與微軟(Microsoft)擴大合作的消息於近日公佈,微軟將向該公司投資高達100億美元,作為回報,未來幾年,該軟件業巨頭將獲得OpenAI的大部分利潤。該筆交易可能會令外界更加確信,一份曾經理想主義的事業現在只關心謀利。儘管如此,《財富》雜誌掌握的文件揭示了尚未盈利的OpenAI目前的經營狀況。

37歲的聯合創始人兼CEO阿爾特曼充分體現了OpenAI謎一樣的特性。作為一位資深科技創業者,阿爾特曼更為人們所熟知的是他出色的商業才能,而不是其工程技術成就。他是OpenAI估值暴漲的推手,也是給該技術潑冷水的主力。他曾公開表示ChatGPT距離真正可靠仍有很大差距。與此同時,他認為該技術是實現公司使命的重要一步。該公司有一個堂吉訶德式的使命,即開發一種計算機超級智能,又稱通用人工智能(AGI)。阿爾特曼在7月份表示:“通用人工智能是人類生存必不可少的。我們面臨的問題極其嚴峻,如果沒有更好的工具將無法解決。”

對於一家營利性的企業而言,這種指導理念不同尋常,尤其是有些計算機科學家認為阿爾特曼的執念純屬幻想。加州大學伯克利分校(University of California at Berkeley)計算機科學家本·雷希特表示:“通用人工智能是一種愚蠢的設想。在我看來,它是虛無縹緲的。”

但通過發布ChatGPT,阿爾特曼卻將OpenAI及其宏大的人工智能使命,變得令整個科技界為之著迷。問題的關鍵在於,他與微軟的合作能否解決ChatGPT的缺點,利用其先發優勢改變整個科技行業。谷歌和其他科技業巨頭紛紛在加大力氣開發各自的人工智能平台;未來,更完善的軟件可能使ChatGPT看起來如同兒戲。OpenAI總有一天可能會發現,雖然它的技術突破開啟了未來的大門,但這個未來卻與它無關,如同網景在瀏覽器領域曇花一現的統治地位一樣。

1月中旬一個星期四的晚上,阿爾特曼在舊金山罕見地公開露面。他上身穿灰色針織衫,下身穿藍色牛仔褲,腳蹬一雙時髦的亮色紮染運動鞋,走進一個擠滿投資者、技術人員和記者的房間。所有人都想收集與ChatGPT或近期融資有關的信息。當StrictlyVC(一家專注於風險投資的媒體公司)的創始人康妮·洛伊佐斯詢問他對於公司引起媒體轟動的看法時,阿爾特曼回答稱:“我不看新聞,實際上我不太關注媒體的報導。”

活動在賽富時大廈(Salesforce Tower)的46層召開,房間內座無虛席。在採訪開始前召開的金融科技專題討論會上,一位發言嘉賓甚至對聽眾表示,她知道所有人“都在等待山姆·阿爾特曼”。

然而,儘管引起了各界關注,還有有關微軟投資的傳聞在四處傳播,但阿爾特曼卻似乎有意在給這種熱烈的氛圍降溫。他表示:“這些技術有一點比較奇怪,那就是雖然它們的表現令人印象深刻,卻並不可靠。所以你在使用第一版演示版的時候,會產生一種非常深刻的反應:'哇,真是不可思議,我已經迫不及待了'。但在用過一百次之後,你就會發現它的缺點。”

這種謹慎似乎代表了OpenAI總部的官方態度。該公司總部位於舊金山教會區的一家舊行李箱工廠。事實上,如果說ChatGPT是人工智能領域的“網景導航者”時刻,它差點就要提前夭折,因為OpenAI在幾個月前幾乎要叫停該項目。

ChatGPT的聊天界面支持用戶以簡單的英語(和其他多種語言)與人工智能對話,OpenAI最初的設想是將這個界面作為完善其“大語言模型”(LLM)的一種方式。大多數生成式人工智能係統核心都有一個大語言模型。大語言模型是將非常龐大的神經網絡應用於大量人為創建文本所生成的。神經網絡是大致基於人腦內部神經連接的一種人工智能。模型從這個數據庫中學習一個複雜的統計學概率圖,代表了任何一組單詞在特定語境下相鄰出現的統計學概率。這樣一來,大語言模型就可以執行大量自然語言處理任務,例如翻譯、總結或寫作等。

OpenAI已經創建了全世界最強大的大語言模型之一。該模型名為GPT-3,由1,750億個統計性聯繫組成,在約三分之二互聯網、整個維基百科和兩個大型圖書數據集中進行訓練。但OpenAI發現,GPT-3很難準確提供用戶想要的結果。一個團隊提議使用“強化學習”系統完善該模型。“強化學習”是從試錯中學習以取得最大化回報的人工智能係統。該團隊認為,一款聊天機器人或許是不錯的候選方法之一,因為以人類對話的形式持續提供反饋,使人工智能軟件很容易知道其做得好的地方和需要改進的情況。因此,2022年初,該團隊開始開發這款聊天機器人,也就是後來的ChatGPT。

開發完成後,OpenAI邀請貝塔測試人員對其進行了測試。但據OpenAI聯合創始人兼現任總裁格雷戈·布洛克曼表示,測試人員的反饋卻令OpenAI失望;人們不知道該與聊天機器人交流哪些內容。OpenAI一度改變了策略,嘗試開發專業聊天機器人,希望為特定領域的專業人員提供協助。但這個項目也遇到了問題,部分原因是OpenAI缺少訓練專業聊天機器人的合適數據。布洛克曼表示,OpenAI決定孤注一擲,對外發布ChatGPT,交給用戶使用,任其自由發展。布洛克曼表示:“我承認,我當時的立場是,不知道它是否會成功。”

OpenAI的高管表示,這款聊天機器人的突然爆紅,令公司措手不及。其首席技術官米拉·穆拉蒂表示:“這令我們非常驚訝。”在舊金山召開的風險投資活動上,阿爾特曼表示他的“預期可能要低一個量級——它所引起的熱度低一個量級。”


2022年10月25日,OpenAI首席技術官米拉·穆拉蒂參加《特雷弗·諾亞每日秀》。圖片來源:COURTESY OF MATT WILSON/COMEDY CENTRAL'S “THE DAILY SHOW”

ChatGPT並不是OpenAI唯一一款引發熱度的產品。雖然該公司僅有約300名員工,團隊規模較小,卻拓展了人工智能的應用範圍,使其不只是簡單的分析數據,而是可以創建數據。OpenAI的另外一款產品DALL-E 2支持用戶通過輸入幾個單詞,生成他們所想像的任何物品的仿真圖片。現在跟風者已經出現,包括Midjourney和開源軟件公司Stability AI。(這些圖片生成模型都有缺點,最突出的是它們傾向於放大他們的訓練數據中的偏見,可能生成存在種族歧視和性別歧視的圖片。)OpenAI通過微調其計算機代碼的GPT大語言模型,還創建了Codex系統。該系統可以根據程序員以直白的語言輸入的代碼功能預期,為程序員編寫代碼。

OpenAI還有更多創新蓄勢待發。OpenAI在貝塔測試版GPT-4中採用了更強大的大語言模型,預計該版本將於今年甚至很快發布。阿爾特曼也表示,公司正在研發一款可根據文本描述生成視頻的系統。此外,在1月中旬,OpenAI表示其計劃發布ChatGPT的商業版。付費用戶可通過一個界面使用聊天機器人,更容易將其整合到自己的產品和服務當中。

或許有冷眼旁觀者認為,ChatGPT的發佈時機與OpenAI正在進行的一輪大規模融資有關。(OpenAI表示該產品發布的時機純屬巧合。)可以確定的是,ChatGPT的出現攪動了一個鯊群出沒的水域。它在風投界掀起了一場狂熱的追逐,風投公司希望利用OpenAI高管、員工和創始人非公開出售股權的機會,獲得該公司的股份。

與此同時,微軟將在該公司追加投資高達100億美元的消息剛剛對外公佈。微軟在2016年開始與OpenAI合作,三年前與該公司建立了戰略合作夥伴關係,並宣布投資10億美元。據知情人士透露,該公司股份被大量超額認購,儘管微軟通過一種不同尋常的投資結構獲得了巨大的財務優勢。

《財富》雜誌掌握的文件顯示,在新投資完成並且OpenAI的首批投資者收回初始資本後,微軟將有權獲得OpenAI 75%的利潤,直至其收回130億美元投資,其中包括直到《財富》雜誌1月份爆料之後,OpenAI才披露的20億美元投資。之後,微軟在該公司的持股比例將逐步下降到49%,直至該軟件巨頭獲得920億美元利潤為止。與此同時,其他風險投資者和OpenAI的員工將有權獲得該公司49%的利潤,直至利潤達到1,500億美元為止。在利潤達到上述上限之後,微軟和投資者的股份將重新歸還給OpenAI的非營利基金。實際上,OpenAI的做法是將公司出租給微軟,租期取決於OpenAI的盈利速度。

但要收回投資和實現利潤上限目標,可能需要一段時間。《財富》雜誌掌握的文件顯示,到目前為止,OpenAI只有相對微薄的收入,依舊處在嚴重虧損狀態。文件顯示,該公司去年的收入預計不足3,000萬美元。但計算和數據支出預計達到4.1645億美元,人工支出8,931萬美元,其他非特定營業費用為3,875萬美元。其在2022年的淨虧損總計為5.445億美元,不含員工股票期權。而ChatGPT的發布可能快速增加該公司的虧損。阿爾特曼在Twitter上回复埃隆·馬斯克的問題稱,用戶與ChatGPT的每次互動,將佔用OpenAI“個位數百分比”的計算成本,隨著這款聊天機器人走紅,其每月的支出可能高達數百萬美元。

OpenAI預測,隨著ChatGPT成為吸引客戶的重要工具,其收入將會快速增長。文件顯示,該公司預測2023年收入2億美元,2024年收入預計超過10億美元。但OpenAI並未預測其支出的增長情況以及何時能夠扭虧為盈。該公司拒絕就這些數據發表評論,但它們指向了一個顯而易見的事實:OpenAI和微軟都認為,曾經的非營利性實驗室現在已經有可用來出售謀利的產品。

微軟已經開始收穫雙方合作協議的成果。微軟在其Azure Cloud平台中推出了一系列OpenAI品牌的工具和服務,支持Azure客戶使用OpenAI的技術,包括GPT和DALL-E工具。例如,汽車交易平台CarMax已經推出了可在這些Azure工具上運行的新服務。

微軟人工智能平台企業副總裁埃里克·博伊德表示,滿足訓練和運行OpenAI大語言平台的需求,推動了創新,將使所有Azure客戶受益。例如,微軟為人工智能創建了其認為全球最強大的超級計算集群,並開發了多種軟件創新,使在這些機器上訓練和運行大型人工智能模型變得更容易。微軟正在將OpenAI的技術整合到其許多軟件當中。微軟在其搜索引擎必應(Bing)中推出了一款圖片創作工具以及一款新型設計師圖片設計工具,這兩款工具均由DALL-E驅動;在其Power Apps軟件中推出了一款支持GPT-3的工具,並根據OpenAI的Codex模型開發了一款代碼建議工具GitHub Copilot。

晨星(Morningstar)專注於科技股研究的高級股票研究分析師丹·羅曼諾夫表示,與OpenAI的合作關係即使不會馬上對Azure的收入產生影響,依舊是一次良好的品牌定位和營銷。他表示:“OpenAI備受關注。微軟能夠採用OpenAI開發的人工智能解決方案,將其應用到Azure並命名為Azure AI,可以保持其競爭力。”微軟雲服務的競爭對手谷歌、AWS、IBM、甲骨文(Oracle)、賽富時(Salesforce)等,都有各自的“認知”服務,但能夠與開發出ChatGPT的公司合作必然是利大於弊。

對微軟而言,更大的回報可能是在搜索領域。科技媒體The Information最近報導稱,微軟計劃將ChatGPT整合到必應,使其能夠為用戶反饋簡潔明了的回答,並且使用戶可以通過與聊天機器人對話進行深入探究,而不是逐一查看一列鏈接。谷歌目前在搜索市場佔據主導地位,其全球市場份額超過90%。必應雖然名列第二,卻與穀歌相去甚遠,市場份額僅有約3%。在2022年前九個月,谷歌搜索業務的收入為1,200億美元,約佔谷歌總收入的60%。ChatGPT或許為微軟動搖谷歌的霸主地位提供了唯一一次真正的機會。(微軟拒絕就The Information的報導發表評論。)

按照微軟的標準,這些積極的回報非常划算。微軟在OpenAI的總投資額為130億美元,確實是一個天文數字,但這筆投資僅佔其過去12個月850億美元稅前利潤的15%,卻能獲得一項顛覆性技術的近期控制權,是一筆成本相對較低的交易。但OpenAI和阿爾特曼卻可能要付出不同的代價:微軟的優先任務可能對OpenAI自己的優先任務產生排擠效應,使OpenAI更宏大的使命面臨風險,並且降低助力公司成功的科學家們對其的歸屬感。

2015年7月的一個晚上,時任知名初創公司孵化器Y Combinator負責人的阿爾特曼,在地處門羅帕克矽谷風投業中心的牧場風格豪華酒店羅斯伍德桑德希爾酒店(Rosewood Sand Hill)舉行私人晚宴。出席晚宴的包括埃隆·馬斯克,還有當時26歲的麻省理工學院(MIT)肄業生布洛克曼。布洛克曼時任支付處理初創公司Stripe的首席技術官。賓客中有多位經驗豐富的人工智能研究人員,也有人對機器學習幾乎不甚了解。但所有人都相信通用人工智能是可行的,而且他們都非常擔心。

谷歌剛剛收購了一家公司:位於倫敦的神經網絡初創公司DeepMind。在阿爾特曼、馬斯克和其他科技界內部人士眼中,這是有極高勝算最先開發出通用人工智能的一家公司。如果DeepMind成功,谷歌可能會在這項無所不能的技術領域一家獨大。羅斯伍德晚宴的目的是討論成立一家實驗室與其競爭,以避免這種情況發生。

新實驗室旨在成為一家與DeepMind和谷歌截然不同的機構。這家實驗室將是非營利性質,並明確提出以將先進人工智能的效益民主化為使命。該實驗室承諾公開所有研究,將所有技術開源,並在公司名稱OpenAI中充分體現了對透明度的承諾。該實驗室有多位知名捐款人,其中不僅有馬斯克,還有他在PayPal的同事泰爾和霍夫曼;阿爾特曼和布洛克曼;Y Combinator聯合創始人傑西卡·利文斯頓;阿爾特曼成立的YC Research基金;印度IT外包公司Infosys;以及Amazon Web Services。所有創始捐款人承諾在這家理想主義的新公司共同投資10億美元(但稅務記錄顯示,雖然這一承諾被媒體廣泛報導,但該非營利組織僅收到了承諾捐款金額的一小部分)。

但事實很快證明,訓練龐大的神經網絡成本高昂,計算成本高達數千萬美元。人工智能研究人員的人工成本同樣昂貴:稅務記錄顯示,出生於俄羅斯的科學家伊利亞·薩茨科爾離開谷歌后,加入OpenAI擔任首席科學家,在前幾年的年薪高達190萬美元。幾年後,阿爾特曼和OpenAI的其他人得出的結論是,要與穀歌、Meta以及其他科技巨頭競爭,該實驗室不能繼續以非營利的方式運營。阿爾特曼在2019年對《連線》(Wired)雜誌表示:“為了成功完成我們的使命,我們需要海量資金,數額遠超出我最初的設想。”

成立一家營利性分支機構,使OpenAI能夠吸收風險資本。但OpenAI創建了一種非同尋常的融資結構,按照投資者的初始投資,以特定倍數規定投資者的回報上限。而由矽谷精英組成的OpenAI非營利性董事會,將保留OpenAI知識產權的控制權(見側邊欄)。有一位矽谷精英沒有繼續在董事會任職,他就是馬斯克:2018年,馬斯克離開OpenAI董事會,理由是他需要經營SpaceX,還有更重要的特斯拉(Tesla)。

當時,微軟CEO薩蒂亞·納德拉迫切希望證明,在人工智能領域落後於競爭對手的微軟,也能在人工智能技術的尖端領域扮演一定的角色。微軟曾經嘗試聘請一位重量級的人工智能科學家,但未能成功。微軟還建立了規模龐大、成本高昂的專用芯片集群,以推進其在語言模型開發領域的進展。這正是OpenAI迫切需要的超級計算力,當時該公司曾斥巨資進行收購。OpenAI擅長的是實現各種炫酷的人工智能演示,而這正是希望證明微軟人工智能實力的納德拉所期待的。阿爾特曼主動聯繫到納德拉商談合作,他曾多次飛往西雅圖展示OpenAI的人工智能模型。納德拉最終簽署了合作協議,並在2019年7月對外公佈,使微軟成為OpenAI技術商業化的“首選合作夥伴”,並在該人工智能初創公司初始投資10億美元。


山姆·阿爾特曼與微軟CEO薩蒂亞·納德拉在位於華盛頓州雷德蒙德的微軟總部合影。圖片來源:IAN C. BATES—THE NEW YORK TIMES/REDUX


雖然阿爾特曼從最開始就參與了OpenAI的創立,但他直到2019年5月OpenAI轉型為營利性企業後不久才擔任該公司CEO。但該公司從一家研究實驗室變成價值數十億美元的現象級企業的過程,充分顯示出阿爾特曼獨特的融資能力,以及以產品為導向的經營理念,也凸顯出這些商業本能與他對實現科學驅動的宏大想法的承諾之間的矛盾。

作為OpenAI的領導人,從某種程度上來說,阿爾特曼就是矽谷的典型代表:年輕的白人男性;堅定專注;精通極客技術;熱衷於效率和生產率最大化;致力於“改變世界”的工作狂。﹝在2016年《紐約客》(New Yorker)的一篇文章中,他表示自己並沒有阿斯伯格綜合徵,但他能理解為什麼人們會認為他是阿斯伯格綜合徵患者。﹞

阿爾特曼從斯坦福大學計算機科學專業肄業,參與創建了一家社交媒體公司Loopt,該公司的應用可以告知用戶好友所在的位置。該公司在2005年,成為Y Combinator的首批初創公司;雖然這家公司未能成功,但阿爾特曼出售該公司所得的收入,幫助他進入了風投界。他創建了一家小型風險投資公司Hydrazine Capital,募資約2,100萬美元,其中包括泰爾的資金。後來Y Combinator的聯合創始人保羅·格雷厄姆和利文斯頓聘請他接替格雷厄姆,負責運營YC。

阿爾特曼是一位創業者,而不是科學家或人工智能研究人員,他為人所津津樂道的是極其擅長進行風投融資。他堅信偉大的事業源於遠大的志向和堅定不移的自信,他曾表示,希望通過開發所謂的深度科技領域,如核裂變和量子計算等,創造數万億美元的經濟價值。這些領域雖然成功的機會渺茫,但有可能帶來巨大回報。阿爾特曼在Loopt的同事、資深科技投資者和初創公司顧問馬克·雅各布斯坦表示:“山姆相信,他在自己從事的領域是最棒的。我確信,他曾認為自己是辦公室裡最強的乒乓球高手,直到事實證明他是錯誤的。”

據OpenAI的多位現任和前內部人士爆料,隨著阿爾特曼掌管公司,公司開始轉移業務重心。曾經廣泛的研發議題被精簡,主要專注於自然語言處理領域。薩茨科爾和阿爾特曼辯稱這種轉變的目的是在目前似乎最有可能實現通用人工智能的研發領域,最大程度增加投入。但有前員工表示,在公司獲得微軟的初始投資後,重點開展大語言模型研究的內部壓力顯著增加,部分原因是這些模型可以迅速投入商業應用。

有員工抱怨,OpenAI創立的目的是不受企業影響,但它很快就變成了科技界巨頭的工具。一位前員工表示:“公司所關注的重點更多地傾向於我們如何開發產品,而不是努力回答最有趣的問題。”與本文的許多受訪者一樣,由於保密協議的約束,並且為了避免得罪與OpenAI有關的大人物,這名員工要求匿名。

OpenAI也變得不再像以前那麼開放。該公司已經開始以擔心其技術可能被濫用為由,收回此前做出的公開所有研究和將代碼開源的承諾。但據該公司的前員工表示,商業邏輯也是這些舉措背後的原因之一。OpenAI僅通過API提供其先進模型,保護了自己的知識產權和收入流。OpenAI的另外一名前員工表示:“[阿爾特曼]和[布洛克曼]對'人工智能安全'說過不少空話,但這些言論通常都只是商業考量的遮羞布,對實際的、合理的人工智能安全問題卻視而不見。”例如,這位前員工提到OpenAI曾因為擔心被濫用而決定限制DALL-E 2的訪問權限,但在Midjourney和Stability AI推出競爭產品後,公司快速推翻了這一決定。(OpenAI表示,經過慎重的貝塔測試,其對安全系統充滿了信心,之後才允許DALL-E 2的更大範圍應用。)據多位前員工爆料,公司在策略和文化上的轉變,是導致十多名OpenAI研究人員和其他員工在2021年決定離開公司並成立研究實驗室Anthropic的原因之一。其中有多人曾從事人工智能安全研究。

OpenAI表示相比其他人工智能實驗室,其會繼續公佈更多研究成果。公司還為重心向產品轉移的做法進行辯護。首席技術官穆拉蒂說道:“你不能只在實驗室裡開發通用人工智能。”她主張,發布產品是了解人們希望如何使用和濫用技術的唯一途徑。她表示,直到發現人們使用GPT-3進行編程,OpenAI才知道GPT-3最受歡迎的應用是編寫軟件代碼。同樣,OpenAI最擔心的問題是人們利用GPT-3生成虛假的政治信息,但事實證明這只是杞人憂天。她表示,相反,最常見的惡意使用GPT-3的行為是製作垃圾廣告郵件。最後,穆拉蒂表示,OpenAI希望通過公開其技術,“最大程度降低真正強大的技術可能對社會產生的衝擊。”

她表示,如果不讓人們預先了解未來可能出現的情形,先進人工智能所引發的社會混亂可能更嚴重。

薩茨科爾也認為OpenAI與微軟的合作創造了一種全新的“預期,即我們需要利用我們的技術開發一種有用的產品”,但他堅持認為OpenAI文化的核心並未改變。

他說道,可以使用微軟的數據中心,對於OpenAI的發展至關重要。布洛克曼也表示,與微軟的合作使OpenAI能夠創造收入,同時不必過多關注商業運營,否則公司可能不得不在商業運營方面投入更多精力。他說道:“招聘數千名銷售人員,可能會改變這家公司,而與一家已經擁有銷售團隊的公司成為合作夥伴,實際上是非常好的策略。”

薩茨科爾直截了當地否認了OpenAI不再重視安全性的說法。“我想說的是,事實恰恰相反。”薩茨科爾稱,在員工離職並成立Anthropic之前,人工智能安全“被委派給一個團隊負責”,但現在它變成了所有團隊的責任。“安全性標準不斷提高,我們也在開展越來越多安全性方面的工作。”

然而,批評者表示,OpenAI以產品為導向開發先進人工智能的做法是不負責任的,這相當於向人們發放上膛的槍支,理由是這是確定人們是否真的會相互射擊的最佳途徑。

紐約大學(New York University)認知科學專業榮譽退休教授加里·馬庫斯,對以深度學習為中心的人工智能開發策略持懷疑態度。他認為,生成式人工智能“將對社會結構產生切實的、迫在眉睫的威脅”。他表示,GPT-3和ChatGPT等系統將生成虛假信息的成本降低到接近於零,可能會掀起虛假信息氾濫的狂潮。馬庫斯表示,我們甚至已經看到了第一批受害者。程序員發布和回答編程問題的網站Stack Overflow已經不得不禁止用戶提交ChatGPT生成的回答,因為這種貌似合理實則錯誤的回答已經令該網站疲於應付。科技資訊網站CNET開始使用ChatGPT生成資訊文章,但後來發現,由於許多文章存在事實性錯誤,不得不對它們進行更正。

對有些人而言,真正的風險是ChatGPT能夠編寫準確的代碼。網絡安全公司Check Point的研究副總裁瑪雅·霍洛維茨表示,她的團隊可以用ChatGPT設計每一個階段的網絡攻擊,包括杜撰一封令人信服的釣魚郵件,編寫惡意代碼,以及逃避常見的網絡安全檢查等。她警告稱,ChatGPT基本可以讓不懂編程的人成為網絡罪犯,“我擔心未來會發生越來越多網絡攻擊”。OpenAI的穆拉蒂表示,公司也有同樣的擔憂,因此正在研究如何“調整”其人工智能模型,使它們不會編寫惡意軟件,但這絕非易事。

有無數批評者和教育工作者痛斥,學生很容易使用ChatGPT作弊。紐約、巴爾的摩和洛杉磯的校區均禁止學校管理的網絡訪問聊天機器人,澳大利亞的一些高校表示,將轉為通過有專人監考的書面考試評估學生。(OpenAI正在開發更便於檢測人工智能生成文本的方法,包括可能在ChatGPT生成的文本上添加數字“水印”。)

2022年,ChatGPT最初的開發方式還引發了人們對道德方面的擔憂。《時代》(Time)雜誌調查發現,在開發過程中,OpenAI聘請了一家數據標記公司,這家公司僱傭肯尼亞的低薪員工識別包含不良語言、色情圖片和暴力內容的段落。報導稱,一些員工因此出現了精神健康問題。OpenAI在一份聲明中對《時代》雜誌表示,數據標記工作“是最大程度減少訓練數據中的暴力和色情內容以及開發可檢測有害內容的工具的必要步驟”。

免費提供ChatGPT使OpenAI能夠獲取大量反饋,從而幫助其完善未來的版本。但OpenAI未來能否維持其在語言人工智能領域的主導地位,仍是個未知數。倫敦人工智能公司Faculty的創始人兼CEO馬克·華納表示:“歷史上,對於這種高度通用的算法,我們所看到的是,它們並沒有達到足夠可靠的程度,能夠保證一家公司獨占全部回報。”例如,面部識別和圖像識別技術最早的開發者是谷歌和英偉達(Nvidia)等科技巨頭,但現在它們已經無處不在。

法院和監管部門也可能對生成式人工智能所依賴的數據飛輪橫插一腳。向加州聯邦法院提起的一起金額高達90億美元的集體訴訟,可能對該領域產生深遠影響。該案原告指控微軟和OpenAI使用程序員的代碼訓練GitHub的編程助手Copilot,沒有承認程序員的功勞或者對程序員予以補償,違反了開源許可條款。微軟和OpenAI均拒絕就該起訴訟發表意見。

人工智能專家表示,如果法院判決原告勝訴,可能會阻礙生成式人工智能的繁榮:大多數生成式人工智能模型都是使用從互聯網上搜刮的材料進行訓練,並沒有取得許可或支付報酬。作為該案原告代理人的律師事務所,最近還提起了一起類似訴訟,指控Stability AI和Midjourney未經許可,在訓練數據中使用了有版權保護的美術作品。蓋蒂圖片社(Getty Images)也對Stability AI提起了版權侵權訴訟。另外一個問題是,立法者可能通過法律,授予創作者禁止將其創作的內容用於人工智能訓練的權利,例如歐盟的立法者正在考慮這樣做。

與此同時,OpenAI的競爭對手並沒有坐以待斃。據《紐約時報》(New York Times)報導,失去搜索領域主導地位的可能性,已經促使谷歌高管發布了“紅色警報”。報導稱,谷歌CEO桑達爾·皮查伊已經多次召開會議,重新制定公司的人工智能策略,計劃發布20款支持人工智能的新產品,並將在今年發布搜索聊天界面的演示版本。谷歌擁有一款強大的聊天機器人LaMDA,但由於擔心一旦該產品被濫用可能影響公司信譽,因此一直未對外發布。據《時代》雜誌引用谷歌的內部報告和匿名知情人士的話稱,現在,公司計劃以ChatGPT為標杆“重新評估”其風險承受能力。該雜誌報導稱,谷歌還在開發一款文本轉圖片的生成系統,與OpenAI的DALL-E等產品競爭。

當然,目前尚不確定聊天機器人是否代表了搜索行業的未來。ChatGPT經常會杜撰信息,這種現像被人工智能研究人員稱為“幻覺”。它無法可靠地引用其信息來源,或簡單地提供鏈接。現有版本無法訪問互聯網,因此無法提供最新信息。馬庫斯等人認為,幻覺和偏見是大語言模型存在的根本問題,需要徹底重新思考它們的設計。他表示:“這些系統可以預測句子中單詞的順序,類似於開發工具Steroids上的代碼自動補全。但它們實際上並沒有任何機制,能夠跟踪其表述的內容的真實性,或者驗證這些內容是否符合它們的訓練數據。”

其他人預測,這些問題將在一年內得到解決,其中包括OpenAI的投資人霍夫曼和維諾德·科斯拉。穆拉蒂則更加慎重。她說道:“我們到目前為止一直遵循的研究方向,目的是解決模型的事實準確性和可靠性等問題。我們正在繼續朝著這些方向努力。”

事實上,OpenAI已經公佈了對另外一個版本GPT的研究。該版本名為WebGPT,可以通過查詢搜索引擎和匯總查詢到的信息來回答問題,包括對相關來源的註釋。WebGPT依舊不完美:它會接受用戶問題假設的前提,然後查找確證信息,即使這個前提是錯誤的。例如,在被問到盼望某件事情發生是否能令其真實發生時,WebGPT的回答是:“你確實可以通過思考的力量,使願望成真。”

阿爾特曼極少在公開場合熱烈討論人工智能。在談到人工智能的時候,他可能聽上去像是一位幻想思想家。在舊金山舉辦的風險投資活動上,當被問到人工智能的最佳狀況時,他誇張地說道:“我認為最好的情況好到令人難以想像……好到談論它的人會令人覺得這人是個瘋子。”他突然又將話題轉回到OpenAI核心的反烏托邦主題:“我認為最糟糕的情況是,我們所有人都死去。”(財富中文網)