CPU、GPU 和 TPU 之間有什麼區別


什麼是 CPU、GPU 和 TPU

它們都是用於計算任務的處理器晶片。可以把你的大腦想像成一台電腦,能夠完成諸如閱讀書籍或解決數學問題的任務。每一項活動都類似於一個計算任務。例如,當你用手機拍照、傳送簡訊或打開應用程式時,你手機的大腦、處理器,就在完成這些計算任務。

這些縮寫分別代表什麼

儘管 CPU、GPU 和 TPU 都是處理器,但它們的專業化程度逐步提高。CPU 是 Central Processing Unit(中央處理單元)的縮寫。這些是通用晶片,可以處理各種不同的任務。類似於你的大腦,如果 CPU 並不擅長某項任務,可能需要更長的時間來完成。

接著是 GPU,即 Graphics Processing Unit(圖形處理單元)。GPU 已經成為加速計算任務的主力,從圖形渲染到 AI 工作負載。它們屬於一種 ASIC(Application-Specific Integrated Circuit,應用專用積體電路)。積體電路通常由硅製成,因此你可能聽到人們將晶片稱為“矽片”——它們其實是同一種東西(是的,“矽谷”這個名字就來源於此!)。簡單來說,ASIC 是為特定用途設計的。

而 TPU,即 Tensor Processing Unit(張量處理單元),是 Google 自己設計的 ASIC。我們從零開始設計 TPU,使其專注於運行基於 AI 的計算任務,比 CPU 和 GPU 更加專業化。TPU 已成為 Google 一些最受歡迎的 AI 服務的核心,包括搜尋、YouTube 和 DeepMind 的大型語言模型。

明白了,所以這些晶片讓我們的裝置能夠正常工作。CPU、GPU 和 TPU 分別在那裡可以找到?

CPU 和 GPU 存在於你每天可能使用的非常熟悉的裝置中:幾乎每部智慧型手機都有 CPU,它們也出現在筆記型電腦等個人計算裝置中。GPU 則常見於高端遊戲系統或某些台式裝置中。TPU 只存在於 Google 的資料中心中:這些資料中心是類似倉庫的建築,裡面有一排排的 TPU,它們全天候運行,以支援 Google 和我們的雲客戶的 AI 服務在全球範圍內運轉。

為什麼建立 TPU

CPU 誕生於 1950 年代末,GPU 則在 1990 年代末出現。而在 Google,我們大約在 10 年前開始考慮 TPU。當時,我們的語音識別服務質量顯著提升,我們意識到,如果每位使用者每天“對 Google 說話”3 分鐘,我們需要將資料中心的電腦數量翻倍。我們知道需要一種比當時市面上現成硬體更高效的解決方案——並且每塊晶片需要提供更多的處理能力。所以,我們決定自己設計!

這裡的 “T” 代表 Tensor,對吧?為什麼?

沒錯——“Tensor”(張量)是用於機器學習的資料結構的通用名稱。簡單來說,在底層,有大量數學運算在支援 AI 任務的實現。在我們最新的 TPU——Trillium 中,我們提高了計算能力:與上一代 TPU v5e 相比,Trillium 每塊晶片的峰值計算性能提升了 4.7 倍。

這具體意味著什麼

這基本上意味著 Trillium 能以比上一代快 4.7 倍的速度完成複雜數學計算。不僅速度更快,它還能處理更大、更複雜的工作負載。

Trillium 的另一個優點是,它是我們迄今為止最可持續的 TPU,它比上一代 TPU 的能效提高了 67%。隨著對 AI 的需求持續飆升,行業需要以可持續的方式擴大基礎設施規模。Trillium 能以更少的能耗完成相同的工作。 (跳動的資料)