深度訪談 | 那個推理比輝達快10倍的Groq創始人發話了:“別傻了,CUDA根本不是護城河!”

一分鐘速覽

  • 輝達的命門不在CUDA,在供應鏈。 2年以上的交付周期是其“阿喀琉斯之踵”,能提供更快交付(如Groq的6個月)的公司擁有巨大優勢。
  • 算力需求永不滿足,別再問泡沫。 聰明錢(科技巨頭、國家)投入AI不是為了投機,而是為了生存。如果算力翻倍,OpenAI的收入也能翻倍。
  • AI的終極瓶頸是能源。 “控制算力的國家控制AI,而沒有能源就沒有算力。” 歐洲因能源政策和官僚主義,正面臨淪為“旅遊經濟體”的風險。

當所有人都在膜拜輝達的算力帝國時,一場顛覆性的變革正在悄然發生。Groq創始人Jonathan Ross的最新訪談,為我們揭示了AI浪潮下被嚴重忽視的真相。

他認為,AI的終局不是模型,而是算力;算力的終局,是能源。在這場決定未來的競賽中,輝達的王座並非牢不可破,而真正的贏家,將是那些能突破物理極限的人。

風暴之眼:那個叫板輝達的Groq究竟是什麼來頭?

在深入探討Jonathan Ross的顛覆性觀點前,我們必須先瞭解他所創立的公司——Groq,這正是他所有判斷的底氣所在。

簡單來說,Groq是一家把“速度”刻在DNA裡的AI晶片公司,被譽為AI推理領域最兇猛的“F1賽車”。

  • 核心產品 LPU:為速度而生
    • Groq不製造像Nvidia那樣的通用GPU,而是創造了一種全新的晶片架構——LPU(語言處理單元)
    • 它的唯一使命,就是在運行大語言模型(即“推理”)時,提供地球上最快的速度和最低的延遲。
  • 與GPU的根本不同:“流水線” vs “項目經理”
    • GPU像一個強大的“項目經理”,手下有數萬名員工(計算核心),但每次任務都需要動態調度和協調,這個過程本身會產生延遲。
    • LPU則像一條預先設定好的“精密流水線”,每個資料的處理路徑和時間都被精確規劃,消除了所有不確定性,從而實現了驚人的、可預測的速度。
  • 結果有多震撼?
    • Groq的雲平台曾演示以每秒超過500個token的速度運行開源大模型,這個速度是當時行業頂尖水平的5到10倍,幾乎實現了AI對話的“零等待”,讓即時語音互動成為可能。
  • 創始人背景:Google TPU之父
    • Groq的創始人Jonathan Ross,是親手主導設計了Google第一代TPU(張量處理單元)的核心人物。TPU是第一款在資料中心成功挑戰Nvidia霸權的專用AI晶片。
    • 因此,當Jonathan Ross評論Nvidia和AI晶片的未來時,他不是一個旁觀者,而是這個領域最頂尖的開創者之一。

忘掉泡沫論吧,巨頭們賭的是“身家性命”

訪談開場,直面“AI泡沫論”。Jonathan的觀點清晰而尖銳:與其糾結於泡沫,不如觀察“聰明錢”的實際行動。

  • 聰明錢的動向:
    • 瘋狂下註: Google、微軟、亞馬遜等巨頭正“像醉酒的水手一樣”花錢,而且一次比一次多。
    • 自用為王: 微軟寧願犧牲Azure的租賃收入,也要將寶貴的GPU留給自己內部使用,因為這樣賺得更多。這證明了AI應用的真實價值。
  • 巨頭們為何如此瘋狂?核心動機是生存,而非投機。
Jonathan分享了一個發人深省的細節:“我曾問一群管理著百億資產的頂級投資人:‘有誰100%確定,10年後AI無法取代你的工作?’ 現場沒有一個人舉手。

對於科技巨頭來說,邏輯完全一樣。今天不惜一切代價投入,是為了確保10年後自己不會被徹底踢出牌桌。

  • 早期石油鑽探的比喻:目前的AI市場就像早期的石油開採,回報極度不均。少數公司(約36家)佔據了99%的收入,但這正是早期市場高風險、高回報的典型特徵。

AI增長的唯一密碼:給我更多算力,我能讓收入翻倍

Jonathan反覆強調一個核心觀點:市場對算力的需求是“永不滿足”的 (insatiable)。

他給出了一個驚人的論斷來證明這一點:

“我敢打賭,如果OpenAI或Anthropic今天能獲得雙倍的推理算力,一個月內,他們的收入幾乎會翻倍。”

為什麼算力如此關鍵?

  • 算力 = 收入:
    • Anthropic 因算力不足,不得不對使用者進行速率限制(rate limits)。
    • OpenAI 為了控製成本,有時會故意降低響應速度,犧牲了使用者體驗。
    • 結論: 頂尖AI公司都被算力“卡著脖子”,無法滿足市場需求。
  • 速度決定一切(多巴胺循環理論):
    • 他以消費品為例,利潤最高的品類(如菸草、軟飲料)都具備“快速反饋”的特點。
    • AI也是如此。速度是決定使用者粘性和轉化率的關鍵。Google每提速100毫秒就能帶來8%的轉化提升,這個定律在AI時代依然有效。
  • 算力是最好調的“旋鈕”:想提升AI產品的質量?有三個途徑:最佳化演算法、增加資料、提升算力。其中,演算法突破很難,高品質資料獲取不易,只有算力,是最直接、最可預測、最有效的提升手段。

兆帝國的裂痕:卡住輝達脖子的“2年之約”

談及輝達,Jonathan毫不吝嗇其價值的肯定。

  • 兆市值預測: “如果5年內輝達市值沒到10兆美元,我會感到驚訝。”

但緊接著,他指出了這個帝國的致命弱點。

  • 真正的命門不是CUDA:他直言:“CUDA鎖定就是胡扯(bullshit),至少在推理市場是這樣。”
  • 供應鏈才是“阿喀琉斯之踵”:
    • 漫長等待: 從下訂單到拿到輝達的GPU,需要等待2年以上
    • 物理瓶頸: 限制產量的不是GPU晶片本身,而是HBM(高頻寬記憶體)等關鍵元件的有限供應。

這正是Groq等挑戰者的機會所在。

  • 6個月 vs. 2年——生與死的區別:
“當我對一位資料中心負責人說,我們的供應鏈能把交付時間縮短到6個月時,他立刻暫停了會議,只關心這一點。”

在模型迭代以月為單位的AI時代,2年的等待周期是不可接受的。交付速度,已經成為比晶片性能更重要的競爭力。

  • 未來的市場格局預測:5年後,輝達仍將憑藉其品牌和生態,佔據市場50%以上的收入,但其售出的晶片數量將只佔少數

AI的物理定律:沒有能源,就沒有王權

“控制算力的國家將控制AI,而沒有能源就不可能有算力。” 這是Jonathan提出的最嚴峻的警告。

  • 歐洲的危機:
“如果歐洲不迅速行動,它的經濟將變成一個旅遊經濟。人們來這裡只是為了看看古色古香的老建築,僅此而已。”
  • 問題與解決方案:
    • 病因: 歐洲的問題不在於缺技術或資源,而在於官僚主義和對風險的恐懼。建造一座核電站,花在許可證上的錢可能是建造成本的3倍。
    • 藥方:
  1. 解放可再生能源: 比如挪威,其風力資源和水電潛力巨大,一個國家就能滿足驚人的能源需求。
  2. 讓市場驅動: 政府應該做的不是投資,而是“鬆綁”,削減繁瑣的審批流程,讓有需求的科技巨頭自己去投資建設能源設施。

未來反轉:AI帶來的不是失業潮,而是“沒人可用”

關於AI與就業的未來,Jonathan的觀點再次顛覆傳統認知。

  • AI帶來的三大社會變革:
  1. 大規模通縮: AI將極大提升各行各業的效率,從農業到供應鏈,一切商品和服務的成本都會下降。
  2. 人們主動“退出”工作: 由於生活成本降低,人們不再需要為了餬口而拚命工作,會選擇工作更少時間,更早退休。
  3. 創造全新的產業與工作: 就像100年前沒人能想像“軟體工程師”一樣,未來會誕生我們今天無法想像的新職業。
  • 結論:我們面臨的不是失業潮,而是勞動力短缺。
  • “Vibe Coding”——未來的新讀寫能力:他認為,未來的程式設計將不再是少數專家的技能。通過與AI對話(Vibe Coding),任何人都能創造工具、解決問題。程式設計將成為一項人人必備的基礎素養,就像今天的閱讀和寫作。

Jonathan最後用一個美麗的比喻總結:

“幾百年前,伽利略的望遠鏡讓我們意識到宇宙的浩瀚,也讓我們感到自身的渺小。但最終,我們學會了欣賞這種壯麗。
LLM就是我們思想的望遠鏡。 它現在可能讓我們感到不安,但在未來,它會讓我們意識到,智能的世界遠比我們想像的更廣闊、更美麗。”

面對這片由算力與能源構築的新大陸,恐懼與機遇並存,而看清底層邏輯的人,才能最終勝出。 (GD梯度下降)