「我們的工作仍是繼續專注於創新和推動技術進步,更好地滿足客戶需求,繼續取得成功,這些都在我們的控制範圍內。我們會盡自己所能幫助政府。」近日,輝達CEO黃仁勳接受了美國《連線》雜誌資深撰稿人Lauren Goode專訪,他談到美國對中國出口管制等話題時如是說道。
「當下,我們第一次大規模製造智慧。」黃仁勳坦言,人工智慧將成為變革社會的根本力量,「AI是人類過去60年所知計算方式的重塑。AI的力量是如此令人難以置信,你無法與之抗衡。
過去兩年來,隨著市場對AI大模型技術持續追捧,輝達負責提供AI算力的GPU也備受科技公司青睞,推升著該公司業績和股價雙重飆升。今年第三季度,輝達營收351億美元,年增94%,淨利193億美元,年增109%。截至發稿,輝達股價今年已飆漲167%,市值為3.2兆美元,是英特爾的36倍。
但這家GPU巨頭也並非沒有憂慮。從去年以來,全球多國對輝達的反壟斷呼聲不斷。一周多前,中國也宣布對輝達進行反壟斷立案調查。依相關法律規定,如果輝達違法事實成立,監管機構最高有可能對該公司罰款超50億美元。
這次在專訪中,黃仁勳並未談及反壟斷調查問題。但他回應了近期的許多熱點,例如與川普政府的關係、英特爾CPU的困境、台積電的角色、新產品Blackwell等。
以下是黃仁勳專訪實錄:
01.人工智慧是基礎設施
Lauren:跟我們說說Soverign AI (主權AI)吧。
黃:現在的情況是,國家意識到人工智慧不可思議的能力,以及人工智慧對自己國家的重要性。他們意識到他們的數據是自然資源的一部分,就像能源或是通訊基礎設施一樣。為了教育,學習,研究和創業,一些人工智慧工廠與資料中心是必要的。
也是出於對主權AI的考慮,我今天特地待在泰國,與當地的合作夥伴一起見證一家AI雲端服務公司的啟動。迄今為止我們已大約有56家AI創企。
Lauren:聽起來你好像將這個時代的生成式AI歸類為基礎設施,我想知道這對AI模型的發展有何意義。
黃:社會中的不同分工都需要用到AI,大學需要、研究人員需要、新創公司需要、大公司也需要,而當社會像這樣各方面都需要一種東西時,它就是基礎設施。
我認為AI將基於互聯網重構一套新的作業系統,我們使用電腦的方式將會改變。過去我們透過程式語言、檢索文件和管理文件等方式與電腦溝通,未來則是透過提示詞直接問問題,要求它為我們做一些事情。這項變化的關鍵在於,搭載多個大語言模型的AI系統取代了傳統作業系統,並且各國都可以創建自己的大語言模型和AI系統。例如,丹麥、瑞典、日本、印尼都在建立自己的大語言模型,印度正在建造幾座,在泰國的大語言模型被稱為ThaiGpt。
這些AI系統並非依賴單一的、參數量巨大的模型,而是整合不同類型、領域的模型。其中有些擅長推理,有些用於AI工具,有些負責資訊檢索,還有防護措施、合成資料產生、獎勵和反思等模型。
02.用大模型寫文章
Lauren:多令人著迷啊,最近AI Agent(AI智能體)的概念在人工智慧領域非常流行,不過其具體的定義似乎還不算清晰。那麼,對你來說,AI Agent是什麼,能做什麼,為什麼有些人稱它為下一波生成式AI呢?
黃:從2012年開始,第一代是感知AI(Perception AI),第二代是生成式AI(Generative AI),再到AI Agent。時至今日,AI可能實際上是一個機器人、一個AI系統或其他形態。我認為這些有關AI Agent的描述,在不同的脈絡脈絡中有時可以互換,不過其核心是不變的,即結合感知、推理和計劃能力,這也是AI的基石。目前,AI可以基於思考鏈(CoT)或其他架構的推理模型,把我們拋給它的任務,拆解成多步驟完成。除此之外,AI也可以產生圖像、音樂、文件等等。這些意味著,未來你可以用各種各樣的方式找到解決問題的方法,你可以用智能體在你的電腦上執行任務,從而騰出時間。
Lauren:你使用了那些AI Agent來幫助你提升工作效率,可以舉例說說怎麼用的嗎?
黃:我現在用了多種AI大模型,我只是因為喜歡他們所以才使用,像是Gemini和ChatGPT。我常用AI來寫一些東西,舉個例子,我會把一個初版的大綱丟給AI,再給它一些我以前演講內容的PDF文檔,讓它來完善我的初稿,真是太棒了。
03.談美國對華出口管制
Lauren:你有說到輝達在全球各地都有不少合作夥伴,但身處於當前政策變動、條件嚴苛的商業環境,你有感到不安嗎,你怎麼想?
黃:世界在變化,AI產業也一直在變。我們現在能夠解決的問題、能夠提供的產品解決方案、能夠實現的能力都是不尋常的。目前,科技產業和軟體產業仍有領先優勢,而以這兩者為基礎的其他產業,將在未來十年內經歷重大變革。
Lauren:這周一,美國商務部擴大了出口管制,管制範圍不僅限於半導體產業。與之相關的上下游供應鏈也會受到一定影響,而輝達的GPU則是其中一環。在你看來,出口管制的理由是否合理,中國市場的競爭對手又會如何應對?
黃:我們的工作是盡最大努力了解和告知半導體產業的動態,以及輝達如何在全球市場運作,並向政府解釋這些事情。提出最好的政策取決於他們。在那之後,我們的工作仍是繼續專注於創新和推動技術進步,更好地滿足客戶的需求,並繼續取得成功。這些都在我們的控制範圍內,就上任的政府而言,我認為我們與政府相處的很好。
Lauren:即將上任的川普政府近期提到了台積電(TSMC),他認為台積電搶走了美國的部分晶片業務。輝達與台積電長期合作,你擔心這會對你與台積電的關係有影響嗎?
黃:無論是在半導體產業,或是全球供應鏈市場,台積電的重要性都是不言而喻的。因此,我們很重視與台積電的合作,也在這份合作關係中越做越好。同時,全球供應鏈對台積電的依賴仍會持續很長一段時間。
Lauren:川普當選新一任總統以來,你有和他交流過嗎?
黃:我已經聯繫了川普總統並向他表示祝賀,告訴他我們會盡自己所能幫助政府。
Lauren:那你是否想要與他進一步討論輝達的業務?
黃: AI顯然非常重要,是一個很宏大的議題。它不僅是一項新技術,更是一個全新的產業。當下,我們第一次大規模製造智慧。我選擇「製造」這個詞的原因是,通常在一個產業形成的過程中,會製造出前所未有的東西。就像電腦產業當初製造軟體一樣,現在AI產業是製造智能,需要能源,需要大量工廠,對一個國家的社會、工業、經濟和技術進步有著重要影響。我很確定新政府和川普總統會對這個行業很感興趣,我很樂意提供任何支持回答我能回答的任何問題。
04.談新產品Blackwell
Lauren:了解到輝達最新的產品Blackwell已經開始交付了,其中有不少大客戶,對吧?
黃:我們在全世界都安裝了Backwell系統。 Blackwell是一個完整的系統,有一堆開關,網絡,計算機,還有一大堆軟體。 Blackwell正在全面生產,一切順利。
Lauren:你認為Blackwell最大的亮點是什麼,是速度更快嗎?它的下游效應又有那些?
黃:它為訓練模型的效率帶來了質的提升。過去通常需要等待幾個月來處理訓練模型所需的數據,然後再訓練模型。 Blackwell可以把這個時間壓縮1/3到1/4,像是本來要用6個月,現在大概只耗時1個半月左右。隨著越來越多公司武裝AI能力,3個月的時間差可能會改變遊戲規則。
在推理方面,我們發現推理過程遵循的不是Zero-shot Learning(零樣本學習)或One-shot Learning(單樣本學習),而是長期思考的模式。它本質上是AI先在腦海中構思出各種不同的解法,然後用更多的算力,提供更恰當的答案。這是一種新的標準化(scaling)方式,我們稱之為測試階段標準化(test time scaling)或推理階段標準化(inference time scaling)。也因為如此,Blackwell的推理能效提升了30倍,速度也更快了。
05.談英特爾的困境
Lauren:前幾天英特爾CEO派崔克‧基辛格(Patrick Gelsinger)辭職,有報告說他是被迫下台的。你知道,20年前沒有人會想像得到英特爾走到了這一步。那你要如何確保輝達在10年、20年之後,不會落得同樣的下場?你採取了那些策略措施來確保這一點?
黃:好問題。我和帕特已有數十年的交情了,非常感謝他的友誼和合作。我們已經為即將推出的許多程式選擇了他們的cpu,並與他們一起開發和推進各種各樣的產品和專案。他們的CPU方面,在他們的PC方面,在資料中心方面確實非常出色。
但在核心上,這是一個挑戰,當一個產業發生一些根本性的變化時,其力量是如此不可思議。我們熟知的現代計算,IBM360系統,中央處理器是在1963、1964年出現的,這持續了大約60年,但因為深度學習和機器學習的技術創新,讓全世界不再是編碼,不再是在CPU上運行的編碼指令,而是在GPU上運作的神經網路的機器學習。
這種趨勢並不是可以與之抗爭的。人工智慧的力量是如此難以置信,你無法與之抗衡。要嘛你乘上這波浪潮,要嘛你只能錯過,沒人能保證。不管CPU的效能多強,你都抵抗不了機器學習的發展勢頭;不管一台電腦多先進,你都抵抗不了行動運算的發展動能。
由於機器學習的出現,不到10年,人們建造、處理工具的方式和內容都發生了根本性的改變。因此,你要長期為這些技術革新做好準備。別忘了,輝達是一家從基礎技術架構起步的公司,成立兩年後,公司實際發展方向就完全改變了。我們很快就認清了一個事實,那便是當時我們所建立的架構、所擁有的技術都是錯的,於是無論如何都要去做GPU,去追趕深度學習領域。後續輝達從一家晶片公司,發展為一家系統公司,再變成了一家基礎設施公司。
Lauren: 那你要如何確保30年後,我們不是在說GPU,那輝達的立場呢?
黃:這可沒法保證,但只要電腦產業仍然重要,我們就會繼續保持敏捷,我們會繼續改變我們自己,在未來保有影響力,這就是我希望看到的結果。(觀網財經)