丨劃重點
①黃仁勳強調生成式AI正以指數速度成長,企業需要快速適應並利用這項技術,而不是觀望,以免落後於技術發展的步伐。
② 黃仁勳認為開源和閉源AI模型將共存,企業需要利用各自的優勢,推動AI技術的發展和應用。
③ 黃仁勳提出,AI的發展需要考慮能源效率和永續性,透過優化運算資源的使用和推動AI模型的推理與生成能力,減少能源消耗,實現更環保的智慧解決方案。
④ 隨著數據的不斷累積和智慧技術的不斷進步,客戶服務將成為企業實現智慧轉型的關鍵領域。
騰訊科技訊據國外媒體報導,在近日舉行的2024年Databricks Data + AI高峰會上,輝達創辦人、CEO黃仁勳與Databricks的聯合創始人、CEO阿里·戈德西(Ali Ghodsi)進行了一場精彩對話。雙方的對話展示了人工智慧和數據處理技術在現代企業中的重要性和發展趨勢,並強調技術創新、數據處理能力和能源效率在推動企業轉型和產業發展中的關鍵作用。
黃仁勳在對話中展望了數據處理和生成式人工智慧的未來。他指出,每家公司的業務數據都如同一座未被充分挖掘的金礦,儘管蘊藏著巨大的價值,但要從中提取深刻的洞察力和智慧一直是一項艱鉅的任務。
黃仁勳也談到開源模式如Llama和DBRX正推動企業轉型為AI公司,活化全球AI運動,促進技術發展和企業創新。透過這次輝達與Databricks的合作,兩家公司將攜手發揮各自在加速運算和生成式人工智慧領域的專長,共同為用戶帶來前所未有的好處。
以下為對話實錄:
主持人:我非常興奮地向大家介紹下一位嘉賓,他是一位無需任何介紹的傑出人物--全球獨一無二的「搖滾巨星」CEO-輝達CEO黃仁勳。請上舞台。非常感謝你的到來!我想先從輝達令人矚目的業績談起,貴公司市值高達3兆美元。五年前你是否曾想過世界會如此迅速地演變,展現出今天這樣令人矚目的景象?
黃仁勳:當然!我從最初就預料到會這樣。
主持人:真是令人讚嘆。能否為台下的CEO們提供一些建議,我們該如何達成目標?
黃仁勳:無論你決定做什麼,我的建議是不要涉足圖形處理器(GPU)的研發。
主持人:我會告訴團隊我們不打算涉足這個領域。我們今天花了許多時間深入討論了數據智能的深遠意義。企業手中握有大量的專有數據,這些數據是建構客製化人工智慧模型的關鍵。這些資料的深度探勘與應用對我們至關重要。你是否也注意到了這個行業趨勢?是否認為我們應該在這領域加大投入?你是否收集到了業界對此問題的聲音和洞見?
黃仁勳:每家企業都像擁有一座金礦,掌握豐富的業務數據。如果你的公司提供了一系列服務或產品,而客戶對這些服務和產品感到滿意,同時提供了寶貴的回饋,那麼你已經累積了大量有價值的數據。這些數據可能涉及客戶資訊、市場動態或供應鏈管理。長期以來,我們都在收集這些數據,擁有龐大的數據量,但直到現在,我們才真正開始從中提煉出有價值的洞見,甚至是更高層次的智慧。
目前,我們對此充滿熱情。我們在晶片設計、缺陷資料庫、新產品和新服務的創造,以及供應鏈管理中都運用了這些資料。這是我們首次採用以資料處理和精細化分析為起點的工程流程,透過建立學習模型,然後部署這些模型,並與資料收集的Flywheel平台相連,以獲得更多的資料。我們公司正透過這種方式,使我們能夠躋身於世界上最大的公司之列。這當然得益於我們公司大量採用人工智慧技術,這些技術幫助我們完成了許多令人矚目的成就。我相信,每家公司都在經歷這樣的變革,因此,我認為我們正處於一個非凡的時代。這個時代的起點是數據,以及對數據的累積和有效利用。
主持人:這真是太令人讚嘆了,非常感謝。目前,關於閉源模型與開源模型之間的辯論正逐漸升溫。開源模型是否能夠迎頭趕上?兩者是否能夠共存?或者最終會被一個單一的閉源巨頭所主導?你對整個開源生態系統有何看法?它在大語言模型的發展中扮演了怎樣的角色?未來又將如何發展?
黃仁勳:我們需要前沿的模型,尤其是那些能夠開拓視野的先進模型。 OpenAI和Google在這方面的工作至關重要,它們不僅拓展了技術邊界,還幫助我們探索了新的可能性。然而,如果審視今年的情況,可能最重要的事件都與開源緊密相關,例如Llama 2、Llama 3、Mistral,以及Databricks團隊所進行的DBRX專案。 DBRX確實是非常酷的成果。它的酷之處在於,它激發了每個企業的活力,使得任何一家公司都有可能轉型為一家人工智慧公司。你一定也注意到了這一點,我們在全球範圍內都看到了這樣的趨勢。我們最近將Llama 3轉化為了一個推理微服務,現在可以下載使用。你可以訪問Hugging Face,當然還有Databricks,現在它已經被全球數百家公司所採納。
這充分說明了開源激發了每一家公司的潛力,讓它們有機會成為人工智慧領域的一份子。在輝達,我們廣泛地使用開源模型,並結合我們自己的資料和技能,對它們進行微調和訓練。如果沒有開源,就不會再有這場激勵全球每家公司轉型為人工智慧的運動。我認為,這無疑是一件具有重大意義的事。
主持人:確實,這是一個令人讚嘆的發展。開源與閉源模型將共存,我們確實需要這兩種模式。您所提到的Nim框架,即Nims,正是我們所關注的。我非常興奮地在這裡宣布,我們將把DBRX整合到Nims中,並在Databricks平台上提供服務。事實上,我們未來開發的所有新模型也將採用這種方式。我們對Nims的前景充滿期待。
黃仁勳:創建大型語言模型API的過程確實是一項技術挑戰。儘管這些模型在目前看來可能不算龐大,但它們在計算上依然非常複雜,技術棧涉及眾多相依性。為此,我們開發了輝達推理微服務Nim,它整合並優化了所有必要的依賴項。輝達擁有專業的工程師團隊,他們專注於這一領域,將複雜的技術封裝成易於使用的微服務。用戶可以在Databricks平台上輕鬆使用這項服務,也可以下載並根據需要進行個人化微調。輝達NeMo(更新版本的神經模組)微服務提供了這種靈活性,確保它能夠在任何雲端環境或本地環境中運行,真正實現了無所不在的人工智慧能力。
主持人:這確實是一項令人讚嘆的技術。能夠在本地部署運行的能力尤其突出,它意味著我們不再完全依賴雲端服務,這無疑是一項巨大的進步。在與客戶的交流中,我們發現他們正致力於培養內部專業技能,以客製化模型並獲得競爭優勢。對於這現象,你有何看法?
黃仁勳:我認為,未來的趨勢是,正如我們今天所見證的,我們已經能夠將幾乎所有類型的信息和數據進行標記化。我們能夠提取其結構、理解其內涵,並學習其表示,無論是聲音、語言、圖像、視頻,還是化學物質、蛋白質,甚至是機器人的動作控製或駕駛操作,我們都能夠進行標記化。由於雲端資料中心正在生產這些標記,我們實際上正在製造一些前所未有的獨特產品。這是首次,我們擁有了被稱為人工智慧超級電腦的工具,它們在專門為此目的設計的工廠中生產標記,我們大規模生產智慧的能力是一項全新的技術。這也是我堅信我們正處於一場新工業革命的開端的原因之一,這場革命不是生產電力,而是生產智慧。
當然,每家公司在其核心都是關於特定領域的智慧。在數據、數據處理、人工智慧及其基礎設施方面,很少有公司能比Databricks擁有更深入的了解。我們專注於我們的專業領域,我們的基礎是這種特定領域的智能,無論是金融服務還是醫療保健等各個領域。最終,我們所有人都將成為智慧製造商。
如果你今天要成為智慧製造商,你將來會有人工智慧領域的人力資源,我們稱之為人工智慧工廠。因此,每個公司都必須開始這項進程。我們正在這樣做,你也將這樣做。我們觀察到,無論公司規模大小,它們都朝著這個方向努力。因此,在未來,我們所有人都將參與這一進程。你將從你的特定領域數據開始,這些數據儲存在Databricks的某個地方,你將處理這些數據,提煉並從中提取智能,然後將其放入Flywheel平台中,你將擁有一個人工智慧工廠。
主持人:這確實是一項令人讚嘆的成就,我對此深信不疑。我們對此充滿熱情,尤其是在數據處理方面。我們Databricks每天處理的資料量極為龐大,大約每天4000兆字節。
黃仁勳:這無疑是目前地球上最大的運算需求之一,也就是所謂的資料處理。事實上,幾乎每一家企業都在進行這項工作。
主持人:確實,資料處理的高並行性使其成為我們重複執行相同操作的理想領域。我對於我們能夠攜手合作,將GPU加速技術引入資料處理充滿期待。我們致力於在核心資料處理領域實現與AI模型相媲美的革命性進步。我們對與您攜手,利用GPU加速技術優化我們的Photon引擎,以邁入將GPU應用於核心資料處理的新時代感到無比激動。目前,這些龐大的工作流程必須依賴CPU來執行,我們也期望它們也能在Nvidia GPU上高效運作。
黃仁勳:順便提一下,這是一個重大的消息:當今計算領域的兩大關鍵趨勢--加速計算和生成式人工智能,Nvidia和Databricks將強強聯合,匯聚我們在這些領域的專業技能,將這些前沿技術帶給每一位用戶。資料處理的加速雖然在技術上極具挑戰,但我們已經投入了五年的時間,不懈努力,終於開發了能夠顯著提升Photon效能的函式庫。這是我們長期努力的成果,現在我們將使Photon加速,讓資料處理變得更加迅速、成本效益更高,非常重要的是,大幅降低能源消耗。
主持人:這確實是一個意義深遠的進展,它在邏輯上非常合理。儘管資料處理過程複雜且充滿特殊情況,但由於其高度的可並行性,我們實際上並不需要通用的運算能力。我們面對的是重複性極高的操作,處理的是龐大的資料集,而不是獨一無二的資料。因此,我對這項技術充滿期待,它不僅具有顛覆現狀的能力,還將大幅提升效能,降低成本,這無疑將帶來令人驚嘆的變革。
黃仁勳:當我們能夠迅速處理大量資料時,研究人員便有可能在某個清晨醒來,突發奇想地說:「讓我們收集網路上的所有資料來訓練一個龐大的模型,因為現在這已不再是耗時費力的工作。但現在,這已成為可能,我們能夠以更低的成本和更高的效率處理前所未有的資料量。這將激發出無限的創新思維,例如:「讓我們利用公司的全部數據來訓練我們的超級人工智慧,」這樣的日子即將到來。
主持人:的確,將整個網路的資料處理,這曾經是個只存在於科幻小說中的概念。我們曾認為這是不可能實現的,直到硬體和基礎設施發展到足夠先進的水平,使得我們能夠對技術進行專門化處理。如今,這已成為現實,每個人都在參與其中。讓我們轉向另一個話題。生成式人工智慧的蓬勃發展確實令人矚目。起初,許多企業以聊天機器人為起點,致力於開發和客製化基於自身數據的聊天機器人。然而,目前我們觀察到人們正逐步拓展至更多尖端的應用場景。展望未來,人工智慧的哪些新應用最令你感到興奮?
黃仁勳:在所有潛在影響中,客戶服務可能是最深遠的領域。對於在座的每家企業而言,客戶服務涉及的開支高達數兆美元,橫跨每個行業,每一個企業。聊天機器人在客戶服務中的應用,其重要性不僅在於自動化能力,更在於其對資料飛輪的貢獻。企業需要捕捉對話,將客戶互動納入資料體系,這無疑將產生大量資料。目前,數據量的成長速度大約是每五年增加十倍。鑑於客戶服務的推動,我預期未來數據量的成長速度可能達到每五年百倍。我們將把所有元素整合入數據飛輪,它將收集更多數據,提煉更深層次的洞察,從而提取更精準的智能信息,提供更優質的服務,甚至實現在問題出現前的主動預防和解決,類似於預防性維護,我們將實現主動式客戶支持,這將進一步推動資料的產生和飛輪的旋轉。因此,我認為客戶服務將是大多數公司實現超級加速的關鍵,尤其是考慮到它將收集的數據量。
我們已經實現了對一切事物的數位化標記,我對我們在化學、蛋白質、碳捕獲材料、酵素、以及創新電池等領域的進展感到興奮。我們也利用生成式人工智慧實現了區域天氣預報的精確度,在以往,這需要超級電腦的運算能力才能達到。物流、保險、以及保護人們免受傷害的能力都將因此而提升。
此外,生成式人工智慧在物理、生物領域,以及3D圖形、數位孿生、電玩虛擬世界建構等方面也展現出巨大潛力。如果貴公司尚未涉足生成式人工智慧,那可能是因為尚未充分關注。事實上,它已經滲透到了每個行業。
主持人:我完全同意你的觀點,人工智慧的應用無疑將遍布各個領域,這不僅合理,更充滿無限可能,令人充滿期待。面對這些新興的前沿領域,我們對數據的需求正日益增長。關於如何幫助企業實現更永續的人工智慧發展,您有何看法?
黃仁勳:永續性可以從多個角度來考慮,尤其是與能源相關的面向。值得注意的是,人工智慧本身並不挑剔其「學習」的地點。我們沒有必要將人工智慧的訓練資料中心設立在那些電網已經承受壓力的人口密集區域。恰恰相反,我們可以將它們安置在能源充足且分佈均勻的地區。全球能源資源十分豐富,關鍵在於如何合理分配與利用。因此,我認為這是我們首次有機會捕捉並利用那些過剩的能源,將其轉化為人工智慧模型的動力,並最終將這些智慧成果回饋給社會,服務於我們的實際需求。
另一個重要的視角是,人工智慧的核心不僅在於模型的訓練,更在於其推理和生成能力。我們訓練模型的最終目的是為了應用它們。當我們著眼於人工智慧的長期效益時,以我先前提及的利用人工智慧進行天氣預報為例,我們不再需要每次都從頭開始模擬物理定律,而是可以透過人工智慧來產生預測結果。這種方法不僅縮短了預測時間,提高了預測精度,更在能源消耗上實現了數千倍的降低。
此外,人工智慧的縱向效益也體現在其他方面,例如透過一次性訓練模型來設計手機晶片,從而為所有用戶節省能源。我相信,隨著時間的推移,人工智慧將展現出其在節能方面的潛力。
最後,關於生成式人工智慧,今天的計算體驗大多是基於檢索的。每次我們點擊手機,雖然看似消耗的能量不多,但實際上它激活了全球的API,檢索信息,點亮了互聯網,然後從不同的數據中心收集少量信息,通過推薦系統呈現給我們。未來,隨著設備上運行的小語言模型變得更加上下文化和生成化,互聯網流量將大幅減少,計算將更多地即時生成,這將極大地節省能源,使計算模型發生根本性轉變。
透過這種方式,我們不僅能夠節省大量能源,還能更有效率地獲得答案。這將徹底改變我們的計算方式,使我們能夠更快地提出問題,得到答案,從而激發出更多有趣的問題。這種與人工智慧合作的未來,將是一個充滿提示和啟發的新時代。
主持人:是的,未來非常令人興奮。好的,我最後一個問題是,我們要如何幫助客戶,也就是在座的各位,今天就開始行動?最好的方法是什麼?
黃仁勳:我之前提到過,我認為Databricks從資料處理擴展到資料治理,再到資料存儲,然後將其縱向擴展到從資料中提取智能,這一轉變是非常有遠見的。我未能記起她的名字,但毫無疑問,那位「Cookie女士」的工作表現極為出色。是Casey吧?請別讓她被其他公司挖走,她剛才在後台的演示確實令人印象深刻。我被她的演示深深吸引,儘管在後台有許多交流的機會,但我個人更傾向於全神貫注地觀看她的演示。她對數據智慧平台的掌握和展示技巧,無疑值得我們的高度讚揚和尊重。我認為這個平台非常了不起,你們讓人們更容易管理資料、擷取資訊、處理資料。資料整理在模型訓練中仍然是一個非常重要的部分。人們談論模型訓練,但在訓練模型之前,你必須弄清楚哪些資料是正確的。這關乎資料品質、資料格式、資料準備。所以,我認為開始的方式是來到Databricks,使用Databricks的資料智慧平台。我說的對嗎?
主持人:完全正確。
黃仁勳:確實,沒有人會反對將他們的平台命名為DIP,也就是資料智慧平台(Data Intelligence Platform)。這個名稱既響亮又富有內涵,我對此十分讚賞。它與Nims一樣,都是令人印象深刻的命名。你完全可以同時使用這兩者,無需做出選擇。取得一個Nims加上DIP,我完全同意這種結合使用的方式,這是一個明智的策略。
無論你計劃做什麼,關鍵在於立即開始行動。你必須積極參與進來,投身於這快速發展的列車之中。切記,生成式人工智慧正以指數速度成長,你不應只觀望或等待。指數趨勢的發展速度是驚人的,幾年之內,落後者將被遠遠拋在後面。因此,立即加入這場科技革命,隨著科技的不斷進步,你也將隨之學習成長。這正是我們所採取的行動方式。
這是一個不應透過旁觀來學習的過程,你不能只透過閱讀來掌握它,真正的學習來自於親身實踐。正如我們所做的,全心投入其中。
主持人:非常感謝。這是一條寶貴的建議。過去十年的合作令人難忘,感謝你所做的一切。我們一直是出色的合作夥伴,期待與Databricks共同迎接下一個十年的輝煌。(騰訊科技)
