Ethan Mollick(伊森‧莫萊克),賓州大學華頓商學院的副教授兼商學院生成式人工智慧實驗室主任。因此,他在人工智慧領域積累了豐富的經驗和知識。作為國外頗具影響力的部落客擁有大量粉絲,許多人都關注他理解人工智慧。
在最近的一次影片訪談中,Mollick教授再次分享了他對OpenAI及其產品開發方向的看法。他討論了為什麼認為OpenAI偏離了創造消費者真正想要使用的產品的初衷,以及該公司擱置的某款產品可能是一個巨大的失誤。他還深入分析了OpenAI對通用人工智慧(AGI)的追求,並指出了大型人工智慧實驗室在處理大企業運營時可能忽視的關鍵方面。
此外,Mollick教授指出公司在實施人工智慧時常犯的錯誤,並分析了為什麼當下的新創公司在人工智慧領域的野心不足。最後,他強調了一般人目前應當如何充分利用人工智慧的潛力,以便更好地適應技術浪潮。
02:31對新Llama 3.1 模型的思考
08:24 AI 會像iPhone 一樣實現逃逸速度?
15:28強大的人工智慧模型應該開源還是閉源?
26:00我們如何更好地利用人工智慧來提高生產力?
41:35 公司創始人對AGI 時間表的不同看法
49:49 人工智慧對教育的影響
57:33能源是未來貨幣
01:00:00 人工智慧在未來的作用
開場白: OpenAI 放棄產品的速度真快,他們想要建構神一樣的機器。如果你有才華橫溢的人才,你就會讓他們為下一代AGI技術努力。如果你有計算資源,你就會將其用於此。我指的是,他們今年的收入運行率意外地達到了30億美元,我認為這完全是偶然的。現在真正的產品其實不存在,只有聊天機器人和API。我認為這個領域的很多人都認為規模可以解決問題。現在的真正問題是,全世界的每一個初創公司都在對抗AGI,這真的很有趣,因為所有的資助者都說,AGI將在未來五年到來,如果真的會到來,為什麼還要資助這些初創公司呢?在AGI的世界裡,它們一個也活不下來。
主持人:準備好了嗎? Ethan,我真的很期待這次對話,我剛才告訴你,我是你的忠實粉絲。首先,非常感謝你今天的加入,我很興奮。嗯,這很棒。我在很多人還不知道我從事AI工作之前,就已經是一名創業學教授很長時間了,所以能夠與風險資本和創業界聯繫起來總是很棒的。對於那些不理解你的工作的人,你能簡單介紹一下你的工作以及你是如何在過去幾年中變得更加知名的嗎?
Ethan Mollick:我自己也是前企業家,所以我幫助共同創立的初創公司發明了付費牆。我仍然覺得我在嘗試彌補那個時候的事情。在90年代晚期,我就一直在嘗試彌補這件事。但後來,我成為了創業教授,我在麻省理工學院接受了培訓,之後一直在沃頓商學院工作。你知道,我做了很多關於教學的工作,思考怎樣的研究可以幫助創業家成功。但我也有這個副業,那就是思考和教授人工智慧,很長一段時間以來,我一直在媒體實驗室工作,與人工智慧的創始人之一Marvin Minsky(馬文·明斯基)一起工作,我是那裡的非技術人員,試圖為世界翻譯實驗室的工作。然後我開始建立工具,指導如何擴大規模地進行創業培訓,因為這實際上非常重要——一點點的創業培訓在人們的生活中可以帶來巨大的改變,我們一直在使用人工智慧和其他工具。所以當人工智慧開始流行時,我處在一個奇怪的位置,實際上很早以前就在使用這些工具。原來,所有認真對待這些東西的人都是電腦科學家,所以我在早期就在那裡,我知道商業、創業和教育的東西,這些東西實際上非常有用。我已經有了相當大的Twitter關注者,然後就有了這樣的馬太效應:所有的實驗室都開始與我交流,我得到了所有的內部資訊,這成了那個領域中的一種自我強化的預言。
主持人:順便說一下,你的Twitter小遊戲太棒了,所以請不要改變,我愛它。我想從這開始,這真是太完美了,我說我們這次做得很隨意,你知道,我們昨天看到新的llama 3.1模型出來了,我真的很想聽聽你的想法,Ethan,你覺得它符合你的預期嗎?
Ethan Mollick:在llama模型中,有幾個非常有趣的面向。其中之一就是開放權重的概念在開源領域的應用。我不覺得意外這個模型已經趕上了當前的前沿技術。我認為人們可能低估了那些閉源實驗室的潛力,他們很快就會發布新的成果。不過,擁有一個類似於GPT-4的開源模型是非常棒的事情,因為它將被廣泛應用。這很有意義,因為這個模型能夠彌補許多技術差距。想想看,現在,任何一個國家的政府所擁有的AI都不如一個普通孩子透過GPT-4獲得的AI強大。有了這樣一個公開可用且可微調的模型,我們可能會看到許多因直接使用AI而產生的奇特現象。雖然它目前可能不如Claude或其他一些模型那樣突出,但隨著人們不斷地研究和改進,這個開放權重的模型將成為一個重大的發展。
主持人:你認為閉源提供者將透過下一次發布彌補多少這種差距?
Ethan Mollick:我們不知道很多,甚至連訓練模型的人也不太懂。有趣的是,訓練模型的人基本上都是電腦科學家。他們做的是電腦科學,他們對自己系統的影響並沒有太大的理解。當OpenAI發布GPT-3.5時,他們並沒有預期會摧毀高等教育,你知道的,教育,因為突然之間每個人都在作弊,對吧?我的意思是,他們已經在作弊了,但現在他們作弊得非常好。我們並沒有預期會有一個大規模的,工作方式如何修正,對吧?所以我認為我們不知道。據我從每個人那裡聽到的,下一代模型會更聰明,這種指數增長會繼續,無論這是否轉化為現實世界的影響,這是另一種擔憂。
主持人: Ethan,我發現的一個挑戰是,每周你都在Twitter上看到不同AI提供者之間的優勢轉移。你知道,OpenAI做了什麼,大家都說太不可思議了,然後Claude做了什麼,大家又說太不可思議了,然後是llama,每周似乎都有一個是贏家,其他的都是輸家,這種優勢的轉移和速度讓我幾乎不知道該如何是好,這可以理解嗎?
Ethan Mollick: 社群媒體喜歡為普通人製造話題,每個人都會繼續使用ChatGPT,因為那是他們正在使用的。他們可能會逐漸轉向Claude,就像狂熱的社區與我談論這些事情的外部世界很不同。我認為在大趨勢中真正重要的是這些模型何時達到頂峰,以及這需要多長時間。我認為擔心誰在某一時刻領先可能不是那麼大的問題,因為大實驗室都會繼續建設。在llama中沒有什麼特別的技巧,他們真的告訴了我們,沒有顯示出某種秘密突破。我們仍然不知道其他一些實驗室是否有隱藏不同的秘密,這在某種程度上仍然是非常早期的。所以我認為,如果你像我一樣對這項技術充滿熱情,那就繼續關注並跟蹤MLA評級,但我確實認為在這個階段不需要理解每一個細節。
讓我先從第四種可能性講起,然後再給你介紹那些無聊的中間部分。第一種可能性是,這就是頂峰了,模型不會有太大的改進,整個事情可能就此減弱。我認為這種情況不太可能,因為我相信不僅模型會變得更好,而且我們甚至還沒有開始將它們整合到工作中。目前人們在工作中使用這些技術的方式是一個瘋狂的過程,實際上是透過與聊天機器人的對話來使用的,所以我們甚至還沒有開始整合。但有可能事情就這樣了,在這種情況下,我們可能需要10年左右的時間來逐步將這些系統整合到人類系統中。我認為一切都會穩定下來,我們不會看到經濟大幅改善,但可能不會看到大規模的變革,除了在某些行業,例如我認為攝影行業可能會發生很大的變化,客戶服務也會因為我們當前的系統而發生很大的變化,這就是一種可能性,沒有太多事情發生。
然後第四種可能性是像神的機器。我們達到了AGI加超級智慧的境界,機器比人類更聰明,我們經歷了智慧爆炸,誰知道接下來會發生什麼。我們這個物種已經好好地生存了幾十萬年,你知道,我們將看看我們的後繼者是誰。這一點引起了許多人的迷戀,因為我認為這是所有人,無論是支持者還是持負面看法的人,他們首先想到的就是超級智慧。我認為更常見的情況是,當我們看到一項技術時,要麼是持續的指數增長,要麼是線性增長和能力增長。
我認為我們對此準備不足。如果你看看這些趨勢線,每個人都在試圖預測,每個模型要麼是從這裡開始的指數增長,要麼是即將達到頂峰。我認為更有可能的是,我們的研究顯示AI在顧問能力的第80百分位水平,明年是第85百分位,第90百分位,第81百分位,第180百分位,我們不知道。所以我認為這是那種世界,一個線性成長的世界,模型每年都會稍微變好。
我認為這種情況比它繼續指數增長,我們逐漸接近那個AGI世界的情況更容易適應。不論是對是錯,我總是在想iPhone的發佈,你知道,第一代iPhone和早期的三代和四代之間有很大的不同,然後慢慢地它只是變成了稍微更好的相機和更好的電池,也許你知道,計算器的按鈕稍微大一點或其他什麼的功能。
主持人:我想知道的是,AI擁有什麼,或者人們相信AI擁有什麼,使得它將擁有發展的逃逸速度,它永遠不會達到那個高原。
Ethan Mollick:你說得對,現在我們處於技術的頂端,都在爭奪誰擁有最好的,比如新iOS發布的計算器是一個重要因素,你就會想,我們現在所處的階段就是擁有一個更好的計算器,這我覺得很有趣。所以我認為確實有一個頂峰。如果你看看像摩爾定律這樣的過程,它實際上是一個持續的指數曲線,已經持續了很多年,不同的是,它是一堆底層技術相互替換。真正的問題是,這種頂線智慧最終會達到什麼極限,AI的侷限性會超越目前的水準嗎?現在你知道,我們談論我們的研究,AI是參差不齊的,所以它在某些事情上做得很好,在其他事情上做得很差,就像任何機器一樣。問題是,這種參差不齊能否被克服,我們還不知道這些問題的答案。 Kevin Scott總是說,你知道,計算能力將解決所有問題,很多人一直相信,效能問題將透過計算能力和更多的原始計算能力得到解答。
主持人:我在節目上有其他人,像是來自Scale AI的Alex Wang ,他們說資料是我們考慮計算、資料或演算法時的核心瓶頸。您認為現在和未來12到24個月內效能的核心瓶頸是什麼?
Ethan Mollick:我會試著回答這個問題,但首先我想從一個與眾不同的觀點開始,這是我總是想首先指出的,對於大多數人來說,他們其實並不關心。比如說,如果大型語言模型達到頂峰,我們發現我們必須轉向使用Mamba 或其他類似的系統,誰在乎呢?沒人在乎。他們正在使用這些系統,我們不知道專家混合模型的真實情況,當你觀察這個像是觀看體育比賽一樣,誰贏了,在什麼情況下贏了,這些頂層能力很重要,還有很多提升的空間。在我看來,電腦科學討論中經常被忽略的是這些系統必須與之互動的人類系統和組織系統。
這就是我們需要看到更多成長的地方。話雖如此,我們不知道瓶頸在那裡。在科學歷史中有一個叫做'反向突出(Reverse Salient)'的概念,技術在向前推進,但總有一些東西在拖後腿,所有的努力都投入到解決這些後進的問題上。在電力的早期,我們有了發電機,但傳輸是一個問題,因此有大量的工作投入到使傳輸更好。在我們當前的新經濟中,問題在於電池,因為太陽能電板很好,但電池不行。我覺得我們就要遇到一堆反向突出了。例如,資料管道不夠好,有沒有辦法使用真實世界資料或合成資料?也許這是終點,但一旦所有科學都集中在一件事上,我們通常能找到前進的道路。我認為會有很多關於那些是滯後指標的爭論,然後每個人都會忘記這些,因為它們得到解決。這不是一個壞方法,也正是技術工作的方式,因為金錢都是在反向突出上賺來的。如果你能成為一個數據公司,而且知道這是大家都卡住的領域,你就能賺到十億美元。這就是資本主義和科學的工作方式。困難的問題是所有金錢和聲望的來源。
主持人:你說到賺錢的方式,我喜歡你之前提到的一個比喻,你說很多人使用淘金熱時期的賣鏟子的比喻,你說這可能不是一個很好的比喻,而蒸汽火車是更恰當的。為什麼你認為這不是一個好的比喻?又為什麼認為蒸汽火車比較合適?
Ethan Mollick:比喻非常有力,我們在人工智慧領域的風投中有很糟糕的比喻。所以,我聽到你想要賣鏟子,首先我不完全知道每個人對此的定義略有不同。他們像,哦不,你想賣計算能力,你想賣幫助人們擴展和選擇他們需要的工具,這實際上不是。首先,這個比喻不清楚,但更深的問題是,這並不是新技術在組織中傳播的方式。你不想向那些試圖淘金的人銷售鏟子,你想要做的是弄清楚如何讓他們使用這項新技術,這根本沒有淘金熱的比喻。相反,蒸汽動力的秘密不在於詹姆斯·瓦特的蒸汽機,儘管它很重要,是一個巨大的突破。順便說一下,直到瓦特的專利過期,這些才被公開適應,真正的價值來自於你工廠中那些熟練的工匠,他們說,我有這個可以來回產生動力的東西,我該如何創造齒輪連接到我的紡織機、我的彈藥製造機、我的瓶子成型工具?是那些熟練的工匠讓所有這些工作並使製造商賺取了所有的錢。所以你現在想成為一個熟練的工匠,你想要弄清楚如何將大型語言模型的來回動力轉化為你組織內部的可用工作。
令人驚訝的是缺乏關於如何有效使用這些工具的人性化描述,就好像沒有人寫過《大型語言模型使用入門》或《人工智慧使用入門》,而這正是每個人都需要的。為什麼這些提供者沒有做出顯而易見所需的行動?我認為如果你與矽谷的人交談,他們非常沉迷於超級智慧的競賽,我完全理解,如果你能建構一個神一樣機器,你就贏了。在矽谷有個信念:如果規模能解決一切問題,那麼投入資源去做任何非擴大規模的事務都是浪費時間。因此,最聰明的人才和所有計算資源都應該致力於增大規模,因為更大的模型似乎能解決所有問題。例如,有一個大型金融機構投入巨資開發了一個基於GPT-3的銷售助理工具,但該工具在ChatGPT3.5發布後立即變得過時。這種情況表明,追求前沿技術雖然是前瞻性的,但也存在著被快速發展的技術處理程序淘汰的風險。目前,市場上缺乏關於人工智慧能力的明確指南,許多人只是基於網路上少數人的經驗描述來使用這些複雜的模型。這種基於不完全資訊的實踐使得人們的使用方式變得類似於隨機操作,構成了一個非常不穩定的情況。
主持人:您剛才提到了矽谷如何看待真正價值所在的問題。一方面,我們有Vinor Coosa說我們不能讓這樣強大的模型開源,我們有Mark Andreon和其他人說它們必須是開放原始碼的。你認為那種方式比較好?
Ethan Mollick:我通常支援技術進步,我認為開放效能讓人們做很多真正有趣的事情。 AI在健康和教育領域有一些非常明顯的低掛果實,我認為這將對世界上許多沒有接觸到好醫生或好導師的地區非常有幫助。對於那些有這些資源的地方,關於何時使用AI這些問題的討論要復雜得多。所以我認為開放模型會有很大的影響,它們會激發創業精神。我們知道,在肯尼亞,那些從AI獲得建議的人作為創始人表現得更好,如果他們本來就做得不錯的話。這裡有很多關於開放性的令人興奮的事情。但也有下行風險,人們說這完全是一回事或另一回事,感覺很奇怪。我確實認為開放模型的防護措施將立即被突破,我們已經知道三到四個低掛的威脅。我認為人們對科幻威脅過於擔心了,目前它還不足以幫助你建立病毒,但未來可能會。我擔心的是,我們整個電腦安全性系統依賴釣魚攻擊非常昂貴,而這能大規模進行釣魚。我們對此感覺如何?這些系統將被用於非常有效的釣魚活動,我們對此怎麼看?我只是覺得沒有這方面的討論。所以我認為開放模型既有風險也有回報。我認為目前沒有很多思考投入這些事情中,這一切都是企業戰略。所以Meta其實不想從模型中賺錢,他們將破壞他們的競爭對手。 Microsoft有機會挑戰Google,所以它在Bing中加入了AI,幾家公司之間有很多這樣的拉鋸戰。我不認為我們真正知道開源人工智慧的全部意義,有點奇怪地同時說它非常強大,能做所有事情,因此風險很高,同時又說它沒什麼大不了的。
主持人:你說沒有很多思考投入其中,你希望看到怎樣的思考與分析?
Ethan Mollick:我認為我們需要為這些模型建立快速反應機制。我擔心的是,多倫多大學的喬舒亞·甘斯(Joshua Gans)教授有一個很好的人工智慧監管模型,我認為這可能是正確的,即當你有一項新技術時,你不知道會出現什麼問題和問題,你進行快速後續監管。你不試圖預先監管,因為你不知道什麼是好的或壞的,但你觀察正在發生的事情,並製訂政策和快速反應。現在我們可以談論政府如何不是為此建立的,如何不與工業界合作,但我認為這就是我們現在對開放原始碼的看法。我們剛剛發布了一個非常強大的模型開源,誰在設置學習這將帶來什麼影響的框架?他們是否有通道回到這些模型的開源製造商?有沒有什麼事件會阻止Meta開源它們的模型?我不知道誰在監視這些東西,是否有任何監控系統來發現這是如何一種方式影響世界的。看來沒有。所以對我來說,一個真正負責任的觀點會是,當然,讓我們發佈開源,但接下來六個月我們要監視,理解這對好壞的影響,然後做出反應。
主持人:我現在在歐洲,這裡有非常嚴格的歐盟人工智慧法案,歐盟在監管方面也特別有才華。我非常擔心,實際上我們會有如此嚴格的監管,以至於它會實際上導致人工智慧在開發和採納上的平台效應。你認為強烈的監管審查是發展更成熟的人工智慧係統的道路上的一個擔憂嗎?
Ethan Mollick:是的,我認為不快速反應是一個問題。你希望人們開發這項新技術,你希望它在你希望開發這些技術的社會中被開發,你希望它們以民主方式被使用。所有這些都表明我們希望看到持續的增長。這並不意味著就像許多對話那樣,要麼沒有任何監管和審查,技術總是對每個人有益,我是技術樂觀主義者,它確實對人們有益,但沒有任何下行風險就很奇怪。另一方面,你有那些我們必須提前進行監管以阻止一些尚未發生的危害的人,而目前的模型水平顯然不會引起這些問題。我們不會從一個llama 3.1獲得一個失控的超級智能,所以我們必須有某種平衡。我認為歐盟確實實施了很多嚴格的措施,我不知道歐洲是否會在人工智慧方面領先。我的意思是,這裡有一個奇怪的生態系統問題。至於風險投資,它一直是美國的優勢,雖然倫敦曾經做得還可以,但除此之外,我所在的賓夕法尼亞學院在2022年獲得的資金比法國和德國所有人加起來還要多。我們已經面臨了一系列的創新生態系統問題,其中監管只是其中之一。我不認為很多人把目光投向歐盟的監管並說這是問題的根源。這是一個多因素問題,涉及歐洲與美國在技術發展上的競爭。每個人都移向矽谷,因為這實際上是一個非常好的策略,幾乎對每個企業都是如此,這裡就像一台不斷運作的機器。
說回更大的問題,一開始對人工智慧實施大量嚴格的監管顯然是一個問題,因為這違背了高安全風險的法規,如歐盟所示。你說了很多很棒的事情,你會告訴你的學生們,如果他們想要提高成功的機會,他們必須搬到矽谷嗎?這是基於一系列研究的實證結果,表明公司,例如,以色列的公司和紐約的公司搬到矽谷,這是問題所在,因為那裡有電腦科學家,事實證明,僅僅使用Zoom是不夠的。我的意思是,至少在疫情之前,我會感到驚訝如果這實際上有所改變,風險投資家和他們投資的公司之間的平均距離大約是40英里,因為當你觀察風險投資家如何花時間時,他們正在建立網絡,並監控它們的投資組合公司,這在當地做起來更容易。 Zoom並不能以同樣的方式進行監控。事實上,當SFO(舊金山國際機場)與另一個城市之間新增直飛航班時,該城市的風險投資會增加,因為飛過去並進行現場監控變得更容易。這是一種在地化的業務。每個人都說這是全球化的,是連接的,但這實際上是一種本地化的業務。
主持人:我想深入理解一些不同的市場參與者,我們已經談到了一些,但我想從AI實驗室開始。我們之前提到了llama和模型進展,在AI實驗室方面,你認為大型AI實驗室對公司本身理解有那些不足?
Ethan Mollick:我認為這是一個非常重要的問題。我指的是,發布的產品真的很奇怪,我認為對使用案例的考慮非常少。你看看這些組織內部有多少人曾在大公司工作過。我常開玩笑說,你知道,當我去西海岸時,那裡全是洗冷水澡和如何長生不老的討論,真的,然後在東海岸,我們就像喝咖啡直到死去,目標就是完成工作,回家,你知道,就是完全不同的風格。在大公司裡就非常不同,我認為對大公司有很多蔑視,大部分聰明人都在大型組織中工作,他們在做的工作並不是矽谷的工作。對每個程式設計師來說,有16個經理,你知道,我認為人們沒有意識到這些東西對他們有什麼用處,結果就是有很多半成品的產品,它們很聰明,然後就被拋棄了。程式碼直譯器對資料分析師來說是一個巨大的、改變世界的產品,但OpenAI部分放棄了它,自從聊天機器人和API之後就沒有推動這一領域的發展。幾乎所有的檔案都是技術檔案,幾乎所有有趣的用例都沒有被技術人員發現,因為他們不擅長使用AI,因為它不像普通技術那樣工作,這些用例是由終端使用者和管理者發現的,系統並不是為這些需求而建構的。所以在技術和使用之間存在著巨大的差距。
那麼,如果代碼直譯器對分析師來說是這樣一個世代定義的產品,為什麼他們會放棄它,或者說不是放棄,但為什麼不以他們開始時的方式繼續發展呢? OpenAI像瘋了一樣放棄優質產品,我認為這些產品是各種人的熱情項目,他們想要建構神一樣的機器。如果你有才華的人,你會讓他們去建構下一代AGI技術。如果你有人力,那就投入其中。如果你有計算能力,也是投入其中。我指的是,他們今年偶然間的營收營運率達到了30億美元,我認為這完全是偶然的。但現在真正的產品並不存在,現在是聊天機器人和API,系統變得更智能,解決了更多問題。我認為這個領域的許多人只是假設規模解決問題,當這些產品無論如何一年後都會過時,為什麼我要花時間考慮如何將這些產品化?
主持人:反過來說,公司本身又是怎麼了,他們應該對AI理解更多什麼?
Ethan Mollick:我一直在和各種組織交談,首先,從一個角度來看,幾乎沒有人在使用這些系統。我的意思是,他們都嘗試過ChatGPT,每當我提問時,幾乎每個人都嘗試過ChatGPT,幾乎總是3.5版本。無論是在矽谷的實際人員(他們不在實驗室),還是在大型銀行,或是在創新專業人士的會議上,大約有5到10%的人使用過這些模型,也許有2-3%的人使用過10小時,這一直是我建議的最低使用時間。我認為沒有引導你面對的是聊天機器人,當人們面對空白頁面時,他們會感到恐慌,你跟系統談論什麼呢?沒有資料,沒有指導,所以人們真的不怎麼使用它。部分問題是他們需要採納,因為當人們開始使用它時,他們會發現用途。最近丹麥的一項研究顯示,在知識密集型工作環境中使用ChatGPT的人,他們估計在超過30%的任務中節省了50%的時間。一旦人們使用它,他們就會發現有提高生產力的作用。那麼問題就變成了,你是如何利用這些工具的,你有什麼政策?
我的意思是,我們可以談論很多關於公司在如何利用這些工具方面做錯了什麼,你希望看到什麼改變?因為這是我們可以根本推動生產力的地方,這無疑是最重要的事。首先,一切都從政策開始。當你看看公司,首先,他們許多甚至不允許訪問GPT-4,因為監管環境不明確。從監管的角度來看,一個很好的事情不僅僅是我們談論過的監管的負面方面,有原因要監管銀行或製藥公司。對於如何積極使用AI,給出清晰的指導將會很有用,我認為已經有一些朝這方面發展的動作。這將是我希望歐盟做得更多的事情,例如確定我們應該推動和開放監管的倫理用例。 」但這延伸到公司政策。公司政策往往非常模糊,例如'不要使用這個'或'可以使用,但不要讓你被解僱的方式使用'。然後,關於你如何獲得獎勵,如果你找到瞭解決工作問題的辦法,有很多不確定性。
我發現,在我演講結束後,所有這些人都會來找我,透露他們一直是秘密的使用AI,他們一直在使用這些工具進行所有工作,但他們沒有告訴任何人,因為他們擔心會被解僱,擔心人們不再尊重他們的工作,因為他們意識到這是由AI寫的。現在Reddit上滿是人們說'我在工作中被認為是個魔法師',他們不想失去這種感覺,他們擔心人們會意識到不需要那麼多員工,所以你會解僱他們或他們的同事。他們擔心如果他們這樣做,你只會分配給他們更多工作,或者不會因此獎勵他們。所以每個人都在偷偷使用AI。我曾與一位銀行員工交談,她告訴我雖然銀行禁止使用ChatGPT,但她還是在手機上用它來撰寫公司通知。因為用它來寫比較方便。事實上,一旦人們開始嘗試,他們就會偷偷地繼續使用。
我說我們需要明確如何獲得獎勵,例如如果我自動化了我的工作會發生什麼。回到我們的工業革命類比,如果你在18世紀初是一個釀酒廠,服務於你的本地社區,因為一切都是本地的,你得到了蒸汽動力,你就有了選擇:我是想解僱很多人,用更少的錢製造相同數量的啤酒,獲得更高的利潤,還是想成為像吉尼斯紀錄那樣擴大生產,到世界各地,僱傭另外100,000人。我們習慣將解決方案視為節省成本的措施,如果我獲得了30%的生產力提升,我就會解僱30%的人。如果是這樣,人們永遠不會向你展示他們如何使用AI,而你也永遠不會在我們真的相信正在發生工業革命的世界中獲勝。
主持人:我總覺得在大多數情況下,我們只是更有效地重新分配人才,正如你所說的,用於新項目、新計劃、企業擴張上面。我發現的令人擔憂的是,特別是在早期,這實際上正在消滅低收入階層。如果說得直白一點,像CL公司透過AI在客戶服務方面提高了70%,結果裁減了很多員工。你尤其可以看到,客戶服務成了一種核心的'特洛伊木馬(曾經代表著精湛的工程技藝,如今被視為一種落後技術)',在我看到的大多數情況下,現在有90%的客戶服務團隊被替換了。你認為我是不是太擔心了?實際上,我們會看到人才的持續重新分配,而不是人才的移除?
Ethan Mollick: 在這種情況下,我認為我們對此有些樂觀了。我再次強調,每次科技革命,人們都會失去工作,然後創造新的工作。但是,我們一直在討論的兩個重要警告:第一,不是每次都這樣。當電話交換從手動轉為機械的,在20世紀30年代開始時,我認為每16個女性中就有一個曾經是電話接線員,那是一份工作。如果你被解僱了,如果你年輕,你可以找到其他工作;如果你年長,你再也找不到那麼好的工作了,因為你真的很擅長作為電話接線員。所以,並非每個工作都能被新出現工作類別取代。另一方面,經歷工業革命真的很糟糕,你可以回顧過去說,'哦,太好了,每個人都找到了更好的工作,他們現在都更富有了'。但也有人因為不想被取代而砸毀機器,那時候有很多動盪,資本主義和社會主義的分歧就是在這個時期興起的,因為那時的動盪非常嚴重。
所以我擔心的一部分是,即使你持樂觀觀點認為一切都會好的,這也不會自動發生。你不能說市場會讓一切都變好,所以我們不用擔心,否則每個人都會失去工作,我們需要普遍基本收入。必須有更具體的東西,是的,經濟將經歷一系列的動盪,我們如何做我們非常不擅長的事情,例如再培訓?這是一個需要解決的問題,而不是必須神化的問題。
主持人:我更擔心的是知識和生產力的分配與財富的分配。我的意思是,矽谷和技術精英中的那1%正在非常好地使用AI及其相關產品,工作效率提高了10倍,更有效率,成本更低。然後是世界其他地方,我們開玩笑說歐洲,但我住在英國,你去英國的某些地方,他們根本不知道ChatGPT是什麼,更不用說如何使用它來建立營銷活動,這些活動的成本比以前低99%,時間只需10%。我認為這只是讓1%的人獲得更多的知識和生產力,而世界可能會落後。我害怕這一點,對嗎?
Ethan Mollick:是的,好的。所以,那個我提到的丹麥研究發現,使用的人主要是男性和富裕階層的人。因為這往往是一種相當常見的技術採用曲線。但AI不同的地方首先是它的普及性,通常使用新技術意味著你得非常擅長使用電腦,正如你所知,從GitHub上獲取一個項目涉及到繁瑣且耗時的工作,這需要大量的時間、精力和金錢投入。但是,聊天機器人可以透過手機在世界上169個國家使用,可以接觸到世界上最好的AI系統。第二,早期的證據顯示,程式設計師並不特別擅長使用AI,因為它並不像他們期望的那樣運作。我最喜歡的例子是Simon Williamson,他非常棒,擅長這些事情,但他在使用Claude進行OCR工作時,對政治捐款進行了檢查,然後他發現Claude拒絕完成工作,因為那些是姓名和地址,儘管它們是公開的,Claude就像'我不想侵犯任何人的隱私'。我們不習慣系統拒絕執行我們的任務,或有時與你爭論,或每次給你不同的答案。因此,程式設計師通常不是最好的使用者,最好的使用者通常是那些真正擅長與人類合作的人。我的妻子可能是全球最頂尖的提示工程師之一。雖然她從未編寫過代碼,但她設計的提示令OpenAI和Anthropic都感到驚嘆,甚至Google都將她的提示作為模型微調的範本。她擁有一套獨特的提示詞範本檔案,這得益於我們長期合作開發教育遊戲的經驗,以及她出色的心理洞察力。這說明,即使不是技術專業人士,也能在這一領域發揮重要作用。她的成功展示了,技術的採納並非僅限於專業人士,關鍵是將這些資訊傳播出去。
主持人:我必須問你提到的關於提示的品質,以及你的妻子在製作優質提示方面的出色能力。你還提到了'白屏當機',即當你面對一個空白範本時不知道該怎麼辦。你之前談到了聊天機器人介面的挑戰以及它是一個多麼奇怪的介面。你認為使用者與人工智慧之間的互動介面將會是什麼樣的?
Ethan Mollick:我認為多模態技術是你需要的答案。它已經具備了所有必要的功能。以Ali Miller為例,她是一位曾在亞馬遜工作、經常思考AI用途的人。她每天早上做頭髮時都會和AI聊天。這些技術已經具備了看和聽的能力,但它們的潛力還沒有被完全發現。它們開始表現得像是隨時待命的助手。我想,一旦我們開始讓這些系統在現實世界中採取行動,我們可能會跳過學習如何使用它們的步驟,直接進入到只需對手機說話,你的智能助理就能幫助你完成任務的階段。所以,這是一個關鍵時期,理解這些技術的工作方式非常重要,它們很快就會成為你手機的一部分。
順便說一下,人們很善於找到減少工作努力的方法,特別是當工具確實能節省時間時。這就是為什麼大學使用ChatGPT的接受率超過70%,而在其他地方的使用率只有幾個百分點。大學生經常討論工作和一起上課,資訊傳播得更快。但在職場,儘管我們面對的是技術任務和項目,卻很少有這樣的交流。所以,訊息的傳播更依賴於朋友間的口口相傳,例如有人會說:『哦,酷,我的朋友告訴我你可以用它解決所有數學問題』。無疑,聊天機器人非常擅長幫助完成家庭作業。現在,如果你想要一個工作效率高於人類的助手,這些機器人幾乎可以在所有情況下解決問題,甚至寫出比大多數人更好的文章。
但在行銷中,要充分利用它們,你需要與機器人合作,調整內容以符合你的品牌風格,這比寫一篇關於喬治華盛頓的標準五段式文章要復雜得多。
主持人:我想問一個我們還沒討論過的問題,關於新創公司本身。你之前說過,你認為在人工智慧面前,初創公司的野心不夠大。他們應該做些什麼,為什麼他們還沒有這樣做? 」
Ethan Mollick:我認為精實方法面臨一些問題,尤其是在應用領域。創投家通常希望看到產品與市場的完美契合。通常的做法是,首先建立初步的商業模型,然後與人交流並在現實世界中測試它。雖然這種方法適合漸進式創新——也就是在已確定的市場需求中進行改進,但它並不適合真正的突破性創新。因為這種模式過於關注立即找到市場解決方案和獲利方式,新創公司常常忽略了培養創新思維。在科技快速變化的環境中,這樣的策略可能導致它們迅速被超越,尤其是在需要激進創新的領域中,僅僅追求產品市場契合並不是一個好策略。
主持人:那麼,在這個蓬勃創新的新時代,一個好的模型是什麼呢?因為我是在增量創新的經濟體中長大的,那裡是測試、迭代、找到產品市場契合,有人為此付費,做得好。那麼在這種激進創新的情況下,正確的模型是什麼?
Ethan Mollick:創投已經資助了這種模式,就像深科技、醫療等領域,你在未來進行更大的投注,在這些領域,當其向世界揭示時,要麼成功,要麼失敗。你是在對技術本身下注,這是風險投資起步的地方,然後有點變了味,變成了'如何快速賺錢的機器'。我的意思是,不是那麼快,仍然需要幾年才能退出,但有這樣的想法,就是最初做很多小賭注,然後在表現好的人身上加倍下注,不在其他人身上加倍下注,這是尋找鑽石原石的一種很好的模式,用於資助增量創新。
市場正在變化,我們習慣於這種變化足夠慢,所以通常不成問題。但現在,我們面臨一個挑戰。我認為我們需要更具想像力,專注於特定主題並建立假設模型。讓我感到奇怪的是,雖然矽谷的許多人都在談論通用人工智慧的到來,但他們建立的應用卻非常狹窄,例如僅在現有產品上增加一些小功能,這顯然是不夠的。我完全理解你的觀點,那麼,我和我的創投同業應該如何改變我們的投資策略?我們應該思考並確定我們對未來的看法,與我們合作的初創公司也必須對人工智慧的未來有明確的預見,並清楚自己的模型將如何適應這種變化
我認為人們需要重新考慮技術採用的方式。以往,如果市場夠大,我們會全力以赴,看那部分市場開始反應,就集中資源在那裡加倍努力。現在,你需要更深入地理解你的技術是如何被人們接受和使用的,它是如何在你的組織內部傳播的,以及它如何適應組織的結構和流程。這要求人們比以往採取更多的計劃和策略,而不是只依賴市場來找出答案。
主持人:你提到了有關在Llama之上做些小的、微不足道的事情,然後你說需要針對性地選擇追隨者和放棄者。這難道不就是垂直化策略和目標策略的核心嗎?
Ethan Mollick:我認為這不僅僅是關於垂直化,而是需要有一個明確的觀點。你必須對未來有一個堅定的看法,預見潛在的空白領域。這涉及到識別那些方面可能存在不均勻的發展,無論是在組織結構還是介面設計上。然而,現在的一個關鍵問題是,幾乎每個新創公司都在努力應對通用人工智慧的挑戰,這很有趣。投資人普遍認為通用人工智慧將在未來五年內實現,如果真是這樣,為什麼還要投資這些新創公司?在一個由通用人工智慧主導的未來,很難有初創公司能夠存活下來。
主持人:對於那些不理解為什麼在通用人工智慧的世界中沒有一個能存活的人來說,Ethan。
Ethan Mollick:通用人工智慧的常見定義是一種比人類在每項任務上都更聰明的機器。所以,在這種機器的決策下,人們將不再需要現有的許多產品,因為機器能更好地決定如何行事,對嗎?你一直在努力為人類製造產品,尋找市場契合點。但隨著通用人工智慧的發展,情況可能會發生變化。例如,當人們希望優化交易策略時,AI可能已經為你完成了優化。雖然我們還不清楚通用人工智慧的具體形態,但像Mark Andreessen這樣的人士預言它即將到來。與此同時,我們資助的公司正助力於此,例如Claude,它可以提出30個產品想法,為特定市場服務,評估它們的品質和可行性,甚至建立原型。使用者可以互動修改這些原型,使產品更具吸引力。例如,如果你想讓遊戲介面更有趣,只需提出需求,AI就能根據你的回饋進行調整。
主持人:你願意麵對世界,你對通用人工智慧世界的看法變得非常重要,這就是我想說的。你覺得看到創始人一側不同人對通用人工智慧到來時間的意見,以及他們對資金需求的看法有趣嗎?
Ethan Mollick:我的意思是,例如,Damis和Zach在通用人工智慧實現的時間上非常長遠,而且坦率地說,他們也不需要任何資金。然後還有其他一些我不會點名的創始人,他們宣稱通用人工智慧會更快到來,但他們需要呈現這樣的未來,因為他們需要資金。我認為不要相信人們說的任何東西。我認為每個人都非常自我。我認為你應該注意的信號是,人們在很大程度上是押注他們的職業生涯,這是可能的,我認為他們關心自己的聲譽,這對我來說是一個信號。他們不必是對的。我和Marvin Minsky)一起工作,就像我說的,他在1957年達特茅斯會議上,他們概述了我認為他是對的人工智慧概念,至少他的導師是對的。我們生活在一個世界中,通用人工智慧總是很快就會到來,所以我認為你可以對任何事情持保留態度,但你需要對這套東西有自己的一致看法。
現在大公司,我認為我們看到很多人警告這很快就會到來。在Meta的論文中,昨天發布的llama 3.1的論文中說,我們看到指數增長將繼續,我們沒有理由認為指數增長會停止。這對你作為一個初創公司意味著什麼?感覺像是相關的問題,你是在為一個未來的世界下注,那麼那個未來的世界看起來是什麼樣的?你不能既說一切都在改變,同時又說我在做這個小事。我也認為加密貨幣在這方面對我們不利,它使所有技術都感覺像是炒作,並再次強調了短期回報,就像如果你只是相信某事會發生,我不認為這是一種很好的思考方式。
我實際上喜歡Sam Altman在節目上說的簡單誤區,關於你是否會被OpenAI碾壓的問題,如果100倍更好的模型讓你感到興奮或恐懼,如果是的話,那麼你就會被碾壓;如果不是,那就太好了。我喜歡它作為一個啟髮式的工具,但我不認為它作為啟髮式的工具是有用的。這意味著什麼,什麼是100倍更好的GPT?這是一個令人困惑的說法,更好是什麼意思?好吧,這意味著什麼?它是一個不均勻的系統,在世界上有空隙,那意味著100倍更好的推理,你該如何理解這個?當你開始研究這些事情時,你會想,我到底該怎麼用它?它改進了100倍,就像神一樣的機器,那又如何呢?我不喜歡這種人本主義觀點,因為我沒有任何方式在那個框架內運作。 100倍更好是什麼意思?它是否能夠處理整個法律檔案並自行進行非常好的法律審查?那會顛覆一個巨大的行業,但這是一個實際問題,關於幻覺率、它處理詞彙的能力、思考詞而不是標記、理解先例、在不同語言間做得好、在其上下文窗口中保持大量資訊,這些都是值得問的有用問題。
它是否可以獨立寫一篇學術論文呢?你給它一個資料集,它產生假設,測試它們,寫一篇非常好的論文,在LaTeX中格式化,寫給編輯的信,處理審稿人的回覆。我們正在接近,但還有很多空白,例如給我一個具體例子,這個東西能做什麼,然後我們可以討論一個啟髮式的方法。但像更好了100倍這樣的說法真的很難,那些用例是提升了28倍,不是100倍,我是開玩笑的,但也許是,我認為這是一個有效的問題。其中一些問題是巨大的空白,有些是小空白。
如果你問我審查法律檔案的問題,那真的不是問題,我們接近了。但如果它能直接做到這一點,那也意味著大幅降低幻覺率,低於他們目前不在的閾值,我們沒有看到,沒有關於幻覺的基準,所以我們不知道我們在幻覺率方面做得有多好。這還意味著能夠無縫地在不同視角間移動,我們今天可以用代理做到這一點,它是基於代理的模型嗎?它採取行動,這裡有很多問題。我只是覺得需要一定程度的具體性,這就是為什麼我說行業具體性很好,如果你是一個很理解法律領域的律師,那麼你可能會有一些關於真正空白在那裡的有趣想法。我不認為很多人工智慧公司知道這一點。我知道這一點,因為我們在教育等方面與他們深入合作,他們真的不理解教育,那裡沒有教育家,所以他們不真正理解老師的工作,也不明白課堂的用途。所以,所有人都認為人工智慧將取代所有人,我認為我們還沒有到那裡。
主持人:你提到了Sam Altman的啟髮式方法,我喜歡那是觸發點,不是嗎?你提到了持有強烈觀點的重要性,以及初創公司應該如何對通用人工智慧的未來以及他們在其中的位置持有強烈觀點,以及組織設計。如果我反過來問你,你在那些方面持有最強烈的觀點?你會先建議或指向那裡? 」
Ethan Mollick:我認為教育是一個好的起點,我們可以討論創業或其他領域,但在教育中,根據我們所擁有的研究,輔導是干預措施的黃金標準,人工智慧是不可思議的一對一輔導員,它是變革性的。但當我發現矽谷的人們,以及人工智慧和教育的人們常常認為,一旦我們有了一個很好的輔導員,我們就不需要老師了,或者像我在學校討厭這個科目,或者人們會自我激勵去學習,這絕對是不真實的,人們並不是自我激勵去學習的,即使所有的電腦科學家都是在某些狹窄領域自學成才的。但你沒有學到任何關於非常重要的話題的知識,因為你只明白一個話題,對吧?像人們需要外在動機去學習,結果顯示,有一個指導方向的教師在課堂上具有價值,將知識付諸實踐也有其價值。所以,即使是一個非常理解你並且非常照顧你的人工智慧輔導員,也不能取代老師。而且,拋開這些不談,我們來討論系統。學校處於社會的複雜系統中,它們不僅提供日托服務,還與教育網絡、我們如何進行資格認證、教師工會等有關,學校的許多方面是不會被人工智慧通過按一個神奇按鈕就能替代的。所以,教育變革的視角比較天真的看法有很大的不同。
主持人:在英國教育今天面臨的最大問題之一,我不確定美國是否相同,您可以告訴我,那就是我們在公立學校看到的班級規模的指數級增長,這是由國家提供的學校,而教育品質顯著下降。當我們看到人工智慧提高教育標準的能力時,我們會看到保持高教育標準與增加的班級規模的能力嗎?您怎麼看待這個問題? 」
Ethan Mollick:我希望如此,但讓我們來討論一下,我在沃頓的同事進行的第一項隨機對照試驗是在土耳其為人們提供GPT-4進行數學輔導。他們沒有進行大量的指派班級使用系統,但事實證明,每個使用它的人,只是使用GPT-4而沒有任何特殊提示,作業成績更高,但在考試中表現更差,因為基本上是AI幫他們完成了工作。一旦有了更好的提示,這種效應就消失了,儘管我們沒有看到教育收益,但我認為這是一個關於不要天真地看待這些系統如何運作的早期跡象。我們需要投入工作去建立支援系統,我絕對相信我們不能天真地認為這些東西可以運作,你不能只是將這些系統投入使用。但一個好的輔導員將會有所不同,我認為從長遠來看,我們將有翻轉課堂,那裡巨大的課堂實際上是可以的,因為你的大部分學習是在課外通過人工智慧輔導員的幫助完成的,然後在課堂內進行活動、練習、應用,大班級的規模就沒那麼重要了。但從這裡到那裡有一條道路要走。
我認為這個節目做得很好,因為我不害怕承認自己的缺點和愚蠢。每個人都在談論AI為教育帶來的難以置信的樂觀情緒,並談論輔導的好處。但我實際上並不真正理解未來的教育畫面是什麼樣的。那是不是看起來像孩子們放學回家,他們只是打開Perplexity或OpenAI,並有另一個輔導員與他們在一起,而且正如你所說,在大多數情況下,他們最終替孩子們完成了工作,所以他們沒有學到東西,它是一種枴杖嗎?我實際上不明白,實際上的教育與AI是什麼樣的,為什麼這是樂觀的。首先,你需要知道關於學習的幾件事,人們通常不會想到的,那就是學習是困難和痛苦的,讓你覺得你在學習的東西並不是真正的學習,你必須做繁重的工作。
沒有解決方案,這就像任何其他事情一樣,例如鍛煉或其他任何事情,你必須被推向你遇到困難的理想困難處,如果你在某件事上沒有失敗,你就沒有足夠努力,這就是為什麼你經常需要外在動力的原因,我們實際上有一些研究。我們知道像活躍學習這樣的方法,在課堂上進行活動,比被動地接受講座更有效。當我們有這些元素時,有一種被稱為改變課堂的方法雖然起步緩慢,但早期證據支援這種想法,即課堂應該是做事情的地方,而課外應該是掌握基礎知識的地方,因為我們可以在課堂環境中讓你做事情。這實際上意味著,在課外你觀看視頻,你的老師講課,所有的講課內容都在課外,這是你的家庭作業,閱讀書籍,然後你的家庭作業在課堂上完成,在那裡你可以在人們面前犯錯,在團隊中工作,你透過觀察其他人學習,老師可以幫助你解決問題。我認為改變課堂是一個非常自然的配合,與基於AI的方法結合的活躍學習。
所以,不是看一個視頻,而是在課外有一個AI輔導員,你登錄學校的網站,那個輔導員會很棒,它會適應你,然後將這些資訊傳遞到課堂設置中,你實際上可以得到高級的東西。順便說一下,我們在沃頓已經建立了這樣一個版本,我們將開源所有這些東西,這種東西並不難想像,我們只是還有很長的路要走。這真的是數量級的改進嗎?如果我們比較那種課堂後的情況,你可以給我提供高質量的視頻,你講課,給你的學生舉例,這很容易做到。相比之下,那個AI輔導員,它可能更好20%,當然,它是個性化的,但它真的是數量級上的改進嗎?教育是一個複雜的系統。所以我認為談論數量級是一個很奇怪的事情,因為每個學生都有自己的才能、能力、興趣和差距。在一對一輔導中的早期工作,我們不談論數量級的提高,因為那在教育領域並不真正適用,很難說什麼是數量級。但我們可以談論成績很多,而經典的研究可能無法複製,但它建立了我們的模型,即一對一輔導在課堂成績中創造了兩個標準差的提升,這是一個相當巨大的改進,你可以從第50百分位提高到第97百分位。我們不知道這是否會持續到人工智慧輔導中,但如果我們能做到,那將是你可能希望的最驚人的改進。我的意思是,10%的改進就很驚人。我覺得我們如果能在一個系統中獲得改進,我們就處於很好的狀態。
我還認為,這還不包括你提到的許多不同的元素,其中外在動機是一個重要部分。我認為有一個輔導員的重要部分是,你實際上與他們建立了聯絡,你想給他們留下深刻印象,你希望他們為你感到驕傲。這是否適用於人工智慧輔導員,你沒有那種人類聯絡?可能嗎?我們實際上不確定這是否是輔導的關鍵,即與人類的聯絡。看來,透過各種輔導方法,迫使人們面對他們不知道的事情,似乎是輔導的很大一部分價值。輔導也往往是反思性的,所以它是如何的——當我們建立一個輔導聊天機器人時,我們測試教育技術聊天機器人的經驗法則是,如果它問你是否理解一個話題或你是否準備好繼續,那它就是一個糟糕的輔導員。
因為人類不知道何時準備好繼續前進,人工智慧應該做的是詢問你問題,探究你所知道的內容,並讓你擴展你不理解的內容,幫助你填補這些空白。所以這不是一對一的教學,我們知道一些確實能夠產生差異的教學方法,例如自我反思、重複練習、低風險測試等都很重要。回到我們之前的討論,專業知識在使人工智慧發揮作用中絕對至關重要。我可以看到一個在創業和教育中的提示,立即告訴你這是否可行,這是個愚蠢的想法還是一個好主意,系統遺漏的微妙之處是否是問題,因為我是專家。如果你不是專家,你可能會覺得看起來很不錯。同樣,我在教學中告訴我的學生如何推銷自己,有趣的研究顯示,風險投資家完全不會被演講者的質量所影響,他們的能力是否優秀完全不重要,而業餘和天使投資者會受到影響,因為你是專家,你已經看過這麼多推銷,你立刻能看穿所有這些事情,你馬上就知道核心問題是什麼,因為你已經看過10,000個推銷,你知道它們在世界上是如何發展的,你必須是一個非常了不起的演講者才能在此之上說服人。
同樣,我認為專業知識在這裡將非常重要。當你看到人工智慧,特別是ChatGPT在家庭作業、課程作業中的普遍性,以及今天許多學生給出的答案時,大學或教育機構還有必要做家庭作業或課程作業嗎?當今大部分作業由人工智慧完成。當然有必要,你看,每個人都已經在作弊了,有一個很好的研究在Rider University發現,家庭作業在2008年可以提高大約80%的人的考試成績,到了2020年只幫助了20%的人,這不是因為家庭作業不再有幫助,而是因為每個人都在作弊。所以我們有解決這個問題的方法,有兩種方式可以在教育中使用人工智慧,一種是謹慎地禁止它,人們仍然會將其用作直譯器之類的東西,但你在課堂上進行考試和藍皮書寫作,我們在數學中解決了這個問題,就是讓人們做練習和工作,沒有人喜歡,但學習沒有捷徑。聽起來很愚蠢,就像你的老師說的,結果證明是真的,你需要做大量的磨練工作才能理解某事,你需要進行交錯練習,你需要做很多事情才能學到東西。
所以我們絕對可以在課堂上讓你做藍皮書工作,我們絕對可以安裝糟糕的監控系統,我不喜歡這種方法,但像一些公司已經有了這種監控你輸入內容的系統,確保你沒有從人工智慧中貼上內容,我不一定推薦這種方法,但這些都是可能性。我認為人們低估了可以做這些事情的程度,家庭作業有價值,作弊是不好的,我們需要定義什麼是人工智慧作弊。
另一個選擇是變革,我的課程現在100%基於人工智慧,學生有人工智慧導師和輔導員,他們與之交談,有基於人工智慧的作業,當他們學習如何招聘時,我們建立了一個模擬器,實際上讓他們必須假裝僱傭某人,人工智慧扮演他們面試的人,並給他們多項選擇答案,他們必須在作業中反思,另一個作業是他們必須教人工智慧做某事。你可以做一些真正激動人心的事情,這不會立刻發生,我們討論的所有不同途徑和功能都需要大量的計算。
主持人:考慮到上次我給你的Sam的引述對你觸動很大,我想再給你一個,他說'計算是未來的貨幣',同時考慮到能源需求,這一代人工智慧將帶來的能源需求是一個關注點。你如何看待這一代人工智慧在社會中的能源需求,以及Sam是否正確,即計算是未來的貨幣? Sam相信通用人工智慧,並且他認為它將在近期內實現。 」
Ethan Mollick:當你與OpenAI內部人士交談時,他們也有同樣的感覺。如果情況確實如此,即按需智能是現實,並且按需智能是耗能大戶,而對按需智能的需求將是無限的,因為如果有了通用人工智慧,我希望它能審查我的所有醫療記錄,監控我們的空域,尋找科學思想,幫助我完成項目,還要為我預訂終極旅行,那麼對智能的需求就是無限的。那麼計算就成為貨幣,能源就成為大問題,我們可能很快就會建造很多核電站。或者通用人工智慧弄清楚如何進行核聚變,那能源就不再是問題,或者我們都變成了電池,像《駭客帝國》那樣,雖然我們產生的瓦特數不足。我認為這不是真正的問題,訓練資料,那是人工智慧將使用我們的原因。不過,現在我主要是在開玩笑。我認為能源辯論很有趣,因為這是末日論者和樂觀主義者喜歡討論的話題。當我遇到對人工智慧持懷疑態度的人時,他們首先談論的是能源使用。事實是,人工智慧每次查詢使用的能源比Google搜尋多得多,可能多兩個數量級,但比人類使用筆記本電腦完成相同工作的能源要少很多數量級。
現在美國1%的電力用於資料中心,其中最多10%用於人工智慧。所以在這成為問題之前,我們還有很大的空間。再次假設,如果通用人工智慧立即可用且非常有用,那麼計算和能源當然就成為問題,然後那就變成了逆萎縮點,如果未來的貨幣是計算,而計算就是能源,那麼在建造你自己的核電站上將有很多錢可賺,所以人們會去做這件事。
主持人:在我們進行快速問答之前,我的一位朋友,也是一位相當知名的風險投資家Jeff Lewis說,在未來的民主中,我們將為演算法投票,而不是為人選投票。你認為人工智慧將如何滲透到選舉系統、選舉投票、我們社會的政治結構中?
Ethan Mollick:當某事對大多數人來說感覺像反烏托邦時,它可能不會很快發生。你知道,人類系統很複雜。我一直看到這種技術觀點,就是在一個理性的世界裡,機器將統治我們所有人。但實際上人們並不希望這樣。就像現在我們已經有演算法可以控制我們生活中的很多事情,例如你的FICO(美國個人消費信用評估公司)信用評分決定了你生活中的很多事情,那就是一種演算法。我們已經有了這些系統,但整體上看到所有事情的演算法還是很難的。另一方面,我們確實發現AI已經非常有說服力了,在一個受控實驗中,與普通人相比,與AI交談的人更有可能改變他們的觀點,改變觀點的可能性高達81.7%。這將在很大程度上改變行銷,從而改變政治。深度偽造已經是一個大問題,儘管它的影響比預期的小,因為你只需展示政治家X的視頻,並聲稱他在第三分鐘說他要吃嬰兒,就能讓本應知道更多的人在網上分享,而他們根本沒有看影片。
就像當我發布一個病毒性推文時,沒有人點擊鏈接。所以,我覺得我們高估了人們,因此也高估了這些事情會有多重要。但在一個AI極具說服力的世界裡,事情確實會改變。在一個AI能夠提供關於一切的非常好的建議的世界裡,包括政治在內的每個角色中都應該有一個AI第二顧問,這將使事情變得更好,但人們不會聽從它。政治變化慢得多,比人們想像的要人性化得多。
主持人:我總是對創始人們說,當他們有有趣的公告或新聞發佈時,我說文章中沒有什麼重要的,我們想要一個好的標題,因為在社交媒體上顯示的小縮圖中,只有那個標題,'Ethan支援什麼什麼',沒有人會點擊實際的文章並深入理解。
Ethan Mollick:順便說一下,這與更大的問題相連,即當我們可以按需生產所有這些東西時,什麼才是真正有價值的?我的意思是,一切都會改變,很難預測一項通用技術如何推出,但我確實認為人們高估了短期變化的速度,正如阿瑪拉定律所示,低估了長期的變化。實際上,作為一個內容創作者,我最大的擔憂是,隨著內容供應的無限增加,價值下降,發現變得更具挑戰性,這是一個很大的擔憂。這個問題已經發生了。我認為真正有趣的是,像Suno和Udio這樣的系統變得越來越好,擁有一個人工智慧生成的歌曲播放列表,其中包括一些真正的音樂家,但也根據喜好製作歌曲,這並不遙遠,至於人們是否會喜歡它,內容創作會發生什麼是一個非常大的問題。我的書是《紐約時報》暢銷書,這很了不起。我認為人們沒有意識到成為《紐約時報》暢銷書需要多少冊,如果你在一周內賣出大約6,000本硬皮書,就能上《紐約時報》暢銷書榜。注意力已經分散在大量內容上。在某些方面,你希望人工智慧能夠創造更好的連接。
主持人:我不是無禮,但你不是沒有,我不能只是寫一本書,花75,000美元,就能成為《紐約時報》暢銷書作者嗎?
Ethan Mollick:人們一直在做這件事。 《紐約時報》有一個小團體的人拒絕討論他們是如何做到的,所以他們使用數字排名,但他們也試圖排除大量購買。所以你會注意到暢銷書榜上有一個小匕首標誌,他們認為他們包括了這些公司,但他們仍然存在潛在的大量購買。我的書因為一家公司購買了500本而得到了小匕首,這不是上榜的主要原因,但他們發現這很可疑。所以他們試圖手動過濾這些。
主持人:所以,是的,透過購買手段,你確實可以提升自己在排行榜上的位置,這種做法很常見。
Ethan Mollick:是的,我見過很多朋友都是創投人,他們有書出版,我就想,真的嗎?有這樣做的方法。你在多個地點分散購買者,他們都這樣做。確實有很多你沒有提名的風險投資人似乎讓很多朋友購買了他們的書籍。
主持人:太神奇了,我喜歡這一點。 Ethan,我可以一直跟你聊天。我想進行一輪快速提問,我說一句簡短的陳述,你給我你的直接想法,聽起來可以嗎?
Ethan Mollick:聽起來很好。
主持人:你相信什麼,而你周圍的大多數人不相信?
Ethan Mollick:我覺得一個非常簡單的想法,即人工智慧實際上比人們認為的要好得多,並且我一直在押注它會變得更好,是大多數人實際上不相信的。
主持人:人工智慧可能帶來的最令人擔憂的未來是什麼? 」
Ethan Mollick:最令人擔憂的未來,我認為是我們失去主動權的未來,不一定是對人工智慧係統,而是對整合了人工智慧的系統。我的意思是,我們有機會使人工智慧被用於促進人類繁榮,這不是一個自動的過程。這意味著當你的公司有人工智慧時,不是解僱人們,而是找出其他有價值的用途,建立幫助人們感覺他們因使用這些東西而完成了更多的系統。我擔心我們沒有看到足夠多的人在模仿這種行為,它都是關於技術本身,然後我們如何節省成本。
主持人:在過去的12個月裡,你最改變想法的是什麼?
Ethan Mollick:我對科技的發展動力持續搖擺不定,但現在我認為它仍有許多潛力,可能會像指數函數那樣持續成長一段時間。我之前對此不太確定,但現在看到了積累的證據,我變得更有信心了。我們之前討論了Kevin Scott的觀點,他幾個月前還沒有表現出透過簡單擴展就能解決所有問題的信心。現在,新一代的模型出現,似乎讓所有實驗室的人都感到驚訝和擔憂。雖然我不確定何時能看到這些模型,但顯然大家看到的進展使我相信未來還有更多可能,大家都在談論這個話題。
主持人:我們是否看到所有大玩家和現有企業都進入晶片行業?我們看到蘋果進入晶片行業,內部化利潤,減少對輝達的依賴,我們是否認為這是所有提供者的一次大轉變?
Ethan Mollick:是的,你在任何供應鏈中的要求就是取得價值。如果你在晶片上花很多錢,你就會進入晶片製造,就像如果你在倉儲上花了很多錢,你會找到一種方法來減少你的倉儲成本一樣。他們必須想出一些東西。
主持人:那些人工智慧發展的面向讓你最感到驚訝? 」
Ethan Mollick:這些東西有多聰明。如果你沒有看過我的Twitter,在那裡我要求AI從《西線無戰事》中刪除關於海軍士兵的參考,請查看,因為這些系統真的很聰明,使用起來非常愉快,我覺得這很令人驚訝。
主持人: Ethan,最後一個問題,你認為人們應該多問你什麼問題,而你卻從未被問過? 」
Ethan Mollick:我認為人們應該問的問題是,為什麼這麼多人開始使用這些系統,然後又停止使用。為什麼這麼多人只是稍微使用一下,而不是永久使用,因為我認為這不僅僅是因為它不起作用。人們以某種方式被這些東西嚇到了,我們並不真正理解人類是如何與這些工具互動的。我們總是談論系統、技術、產業將如何改變。我非常擔心的是,當你作為一個企業經理意識到AI在做你的工作,而沒人在乎時會發生什麼。這意味著工作的性質將如何改變,如果人們不在乎,如果你的老闆用AI代替你要寫的電子郵件,那麼這種意義危機是我們還沒有足夠討論的。被工作取代是一回事,部分取代自己並意識到我為什麼要這麼做是另一回事,我認為這將是我們還沒有討論的更大問題。
主持人:最後,我要為這次討論涉及如此多不同的話題向你道歉,並感謝你耐心回答我的一些基本問題。
Ethan Mollick:這次對話對一個喜歡你寫作的人來說真是個巨大的樂趣。我的朋友,這真是一次很棒的體驗。請儘量不要告訴Sam Altman我不同意他的觀點,因為他正在建立一種非常先進的技術,我不想讓他對我感到憤怒。 (財經ThinkTank)