Google最強AI晶片狙擊輝達B200,性能狂飆3600倍!Google版MCP一統AI智能體宇宙

【新智元導讀】Google重磅發佈第七代TPU Ironwood,專為推理設計,性能較從初代飆升3600倍,可與輝達B200一較高下。不僅如此,Google還帶來了Veo 2等多款模型全新升級,就連「Google版」MCP協議也公佈了。


推理時代的首款TPU誕生了!

昨晚,一年一度的Google雲大會上,首次亮相了Google第七代TPU——Ironwood,直接叫板輝達Blackwell B200。

它是Google迄今為止性能最強、可擴展性最高的定製AI加速器,也是首款專為推理設計的加速器。



相較於2018年的第一代TPU,Ironwood推理性能飆漲3600倍,效率提升了29倍。

甚至,第七代全新TPU的性能是世界第一大超算的24倍。Google將於今年晚些時候正式推出TPU v7。



繼MPC之後,Google大會上首次亮相Agent2Agent(A2A)開放協議,為智能體提供一個通用語言,可以在不同生態系統溝通協作。

還有ADK、Agentspace,為開發者提供了全面建構、操作、管理AI智能體的能力。

此外,Google雲大會精彩紛呈,Veo 2、Imagen 3、Chirp 3紛紛迭代升級,文字轉音樂模型Lyria,Vertex AI成為唯一覆蓋視訊、圖像、語音和音樂的全新生成式AI平台。

下一步,極具性價比Gemini 2.5 Flash也將登錄Vertex AI。



推理時代首款TPU出世,媲美B200

Ironwood的誕生,不僅標誌著Google在AI硬體又一大突破,還代表著AI基礎設施的重大轉變。

在Google看來,當下被動「響應式」模型,正轉變為主動「生成式」智能體。



這種轉變的核心在於,AI不再僅僅停留在提供原始資料層面,而是能夠主動檢索資訊、生成見解。

這正是在這個「推理時代」,Google對未來AI基礎設施的定義:更智能、更主動、更具協作性。


主要特性

· 性能顯著提升,同時注重功耗效率,使AI工作負載能夠更具成本效益地運行。

相比起第六代TPU Trillium,Ironwood在功耗效率(perf/watt)上實現了2倍的提升;比2018年推出的首款Cloud TPU,更是高出了近30倍。

同時,Google先進的液冷解決方案和最佳化的晶片設計,即使在持續、繁重的AI工作負載下,也能可靠地維持高達標準風冷兩倍的性能。

圖 3. 功耗效率相較於TPU v2提升了29.3倍


· 高頻寬記憶體(HBM)容量大幅增加

Ironwood晶片搭載了高達192GB的視訊記憶體,是Trillium的6倍。

如此一來,便可以處理更大的模型和資料集,同時還減少了頻繁資料傳輸的需求,進而提高了性能。

· HBM頻寬顯著提高

Ironwood晶片在頻寬方面提升到了驚人的7.2 Tbps,是Trillium的4.5倍。

極高的頻寬確保了快速的資料訪問,這對於現代AI中常見的記憶體密集型工作負載至關重要。



· 晶片間互連(ICI)頻寬增強

Ironwood的雙向頻寬已增加到1.2 Tbps,是Trillium的1.5倍。這種晶片之間更快的通訊,有助於大規模高效的分佈式訓練和推理。


用Ironwood驅動推理時代

Ironwood為要求最嚴苛的AI工作負載提供了所需的大規模平行處理能力,例如用於訓練和推理的、具有思考能力的超大規模稠密LLM或MoE模型。

對於GoogleCloud客戶,Ironwood可根據AI工作負載需求提供兩種規格——256晶片或9,216晶片。

圖 1. FP8浮點運算峰值性能相較於TPU v2提升了3600倍


其中,每個單獨的晶片峰值算力達4,614 TFLOPs。

當擴展到每個pod 9,216個晶片,總計達到42.5 Exaflop時,Ironwood的算力是世界上最大的超級電腦El Capitan的24倍以上——後者每個pod僅能提供1.7 Exaflops。

不僅如此,Ironwood還配備了增強版的專門用於處理高級排序和推薦任務的加速器——SparseCore。從而為更廣泛的工作負載提供加速,包括超越傳統AI領域,進入金融和科學領域。

Pathways是由GoogleDeepMind開發的ML執行階段,可在多個TPU晶片上實現高效的分散式運算。

GoogleCloud上的Pathways使得超越單個Ironwood Pod變得簡單直接,能夠將數十萬個Ironwood晶片組合在一起,從而快速推進生成式AI計算的前沿。

圖 2. Ironwood原生支援FP8,而v4和v5p的峰值TFlops為模擬值


OpenAI研究員針對Ironwood與輝達GB 200做了性能對比,並表示TPU v7與GB200性能相當,甚至略勝一籌。



全模態AI平台來了,Veo 2再升級

隨著音樂功能的加入,Vertex AI 現在是唯一一個擁有涵蓋所有模態——視訊、圖像、語音和音樂——的生成式媒體模型的平台。

這次放出的重大更新共有四項:

· 文字轉音樂模型Lyria,讓客戶可以從文字提示詞開始,生成完整的、生產就緒的素材。

· Veo 2的新編輯和攝影機控制功能,可幫助企業客戶精確地最佳化和再利用視訊內容。

· Chirp 3現在包含了Instant Custom Voice,這是一種僅需10秒音訊輸入即可建立定製語音的新方法。

· Imagen 3改進了圖像生成和圖像修復能力,用於重建圖像中缺失或損壞的部分,並使物體移除編輯的質量更高。


Lyria:文生音樂模型

Lyria能生成高保真音訊,細緻捕捉精妙之處,並能在多種音樂流派中提供豐富、細節詳盡的樂曲。

· 企業可以提升品牌體驗

根據品牌獨特的調性,為行銷活動、產品發佈或沉浸式店內體驗快速定製配樂。

通過Lyria,企業可以建立與目標受眾產生深度共鳴的聲音,培養情感聯絡並增強品牌記憶度。

· 創作者可以簡化內容創作流程

對於視訊製作、播客和數字內容創作而言,尋找完美的免版稅音樂可能是一個耗時且昂貴的過程。

而Lyria可以在幾分鐘內生成定製音樂曲目,直接契合您內容的情緒、節奏和敘事,從而幫助加速製作工作流程並降低授權成本。例如:

創作一首高能的比波普 (Bebop) 曲調。優先突出令人眩暈的薩克斯管和小號獨奏,以閃電般的速度交換複雜的樂句。鋼琴應提供打擊樂式的和弦伴奏,行進貝斯 (walking bass) 和快節奏的鼓點驅動著狂熱的能量。基調應是令人振奮且激烈的。捕捉深夜、煙霧繚繞的爵士俱樂部的感覺,展示精湛技藝和即興創作。要讓聽眾無法安坐。


Veo 2:擴展編輯功能

Veo 2則為視訊的建立、編輯和視覺效果加入了一套強大的功能集,使其從一個生成工具轉變為一個全面的視訊創作和編輯平台:

· 視訊修復 (Inpainting):無需手動修飾即可獲得乾淨、專業的編輯效果。

你可以移除視訊中不需要的背景圖像、徽標或干擾物,使它們在每一幀中都平滑完美地消失,看起來就像從未存在過一樣。


· 畫面擴展 (Outpainting):擴展現有視訊素材的畫面,將傳統視訊轉換為針對網頁和移動平台最佳化的格式。

你可以輕鬆調整內容來適應不同的螢幕尺寸和寬高比——例如,將橫向視訊轉換為用於社交媒體短影片的縱向視訊。


· 應用複雜的電影拍攝技術:新功能包括指導鏡頭構圖、攝影機角度和節奏等。

團隊可以輕鬆運用複雜的電影拍攝技術,無需複雜的提示詞或專業知識。

例如,使用攝影機預設向不同方向移動攝影機、建立延時攝影效果或生成無人機風格鏡頭。

· 通過連接兩個現有素材建立連貫的視訊。

借助插值(Interpolation)功能,你可以定義視訊序列的開始和結束,讓Veo無縫生成連接幀。

這確保了平滑過渡並保持視覺連續性,從而創造出精美且專業的最終成品。


Chirp 3:即時定製語音和轉錄功能更新

Chirp 3的高畫質語音(HD voices)功能提供了超過35種語言的自然逼真語音,並有8種說話人選項。

除此之外,Google還新增了兩個功能:

· 即時定製語音(Instant Custom Voice)

只需要10秒的音訊輸入,即可生成逼真的定製語音。這使得企業能夠個性化呼叫中心、開發無障礙內容,並建立獨特的品牌聲音——同時保持一致的品牌形象。

· 帶說話人日誌功能的轉錄(Transcription with Diarization)

這項強大的功能可以精確地分離和識別多人錄音中的單個說話人,顯著提高轉錄內容的清晰度和可用性,適用於會議紀要、播客分析和多方通話錄音等應用場景。

Imagen 3:改進質量和編輯功能

作為Google最高品質的文字轉圖像模型,Imagen 3能夠生成具有比之前更好細節、更豐富光照和更少干擾性偽影的圖像。

這次,Google顯著改進了Imagen 3的圖像修復(inpainting)能力,用於重建圖像中缺失或損壞的部分。

尤其是在物體移除(object removal)方面,不僅質量更高,而且效果也更加自然。


MCP之後,Google再造A2A協議

智能體可以幫助人們做很多工作,從訂購新電腦,到協助客服人員,再到支援供應鏈規劃。

智能體越來越實用的關鍵在於讓它們能夠在一個動態的多智能體生態系統中相互協作,跨越孤立的資料系統和應用程式。

為此,Google推出了全新的開放協議——Agent2Agent(A2A),獲得了超過50家合作夥伴的支援和貢獻。

A2A協議將使AI智能體能夠相互通訊,安全地交換資訊,並在各種企業平台或應用程式上協調行動。

它是一個開放協議,與Anthropic的模型上下文協議(MCP)相輔相成。


A2A設計原則

A2A遵循了五大核心原則:

· 擁抱智能體的能力:A2A致力於讓智能體以它們自然、非結構化的方式協作。

· 基於現有標準:A2A建構在已有的、廣泛使用的標準之上,比如HTTP、SSE、JSON-RPC。

· 默認安全:A2A從設計之初就支援企業等級的認證和授權,與OpenAPI的認證機制保持一致,確保安全性。

· 支援長時間運行的任務:設計A2A時考慮了靈活性,它能勝任從快速任務到需要數小時甚至數天的深入研究等多種場景,尤其是在有人的參與下。

· 不限模態:智能體的世界不只有文字,因此我們設計A2A時支援多種模態,包括音訊和視訊流,讓它更加多樣化。


A2A如何工作

A2A讓「客戶端」智能體和「遠端」智能體之間的溝通變得更順暢。

客戶端智能體負責制定和傳達任務,而遠端智能體則負責執行這些任務,儘量提供正確的資訊或採取正確的行動。這個互動涉及幾個關鍵功能:

· 能力發現:智能體可以通過JSON格式的「Agent Card」來展示自己的能力。客戶端智能體可以根據這個「名片」找到最適合執行某項任務的智能體,並通過A2A與遠端智能體溝通。

· 任務管理:客戶端智能體和遠端智能體之間的交流以完成任務為核心,目的是滿足使用者的需求。

· 協作:智能體之間可以互相傳送消息,分享上下文、回覆、產物或使用者指令。

· 使用者體驗協商:每條消息中包含「parts,」,這是一個完整的內容單元,比如一張生成的圖片。


實例:尋找候選人

使用者(比如招聘經理)可以讓自己的智能體去尋找符合職位描述的候選人。

這個智能體會與其他專業智能體互動,幫你挖掘潛在候選人。使用者收到推薦名單後,可以再指示智能體安排後續面試,讓找人的過程更順暢。面試結束後,還可以讓另一個智能體幫忙做背景調查。

A2A有望開啟一個智能體相互操作的新時代,推動創新,打造更強大、更靈活的AI智能體系統。我們相信,這個協議將為未來鋪平道路,讓智能體能夠無縫協作,解決複雜問題,提升我們的生活。

我們致力於與合作夥伴和社區一起,公開建構這個協議。我們會把協議開源,並為貢獻者設立清晰的參與路徑。


GoogleAI程式碼助手,變身超強智能體

此次大會的另一個更新,就是Google的AI編碼助手——Gemini Code Assist,已經在預覽中獲得了「智能體」能力!

在Cloud Next大會上,Google宣佈:Code Assist現在可以部署新的AI智能體,這些智能體可以執行多個步驟,來完成複雜的程式設計任務。

例如,這些智能體可以從Google Docs中的產品規格建立應用程式,或者將程式碼從一種語言轉換為另一種語言。

另外,Code Assist現在除了其他編碼環境外,還可在Android Studio中使用。

這次升級,也是Google被GitHub Copilot、Cursor和Devin這些競爭者給逼瘋了。

肉眼可見,現在AI程式設計隱含著巨大的掘金市場,各家的競爭也日趨白熱化。

不過,Code Assist能做到什麼程度,目前還不清楚。研究表明,即使是今天最好的程式碼生成AI,也往往會引入安全漏洞和錯誤,這是由於程式設計邏輯理解能力的弱點。

比如對Devin的一項評估就發現,它只完成了20項任務中的3項。

接下來,就讓我們期待Gemini Code Assist在實際程式設計環境中的表現了。 (新智元)