AI時代的鑰匙,出現了?


在近10年的不斷探索之下,真正的AI時代離我們越來越近。從各種大語言基礎模型,再到如今不斷出現的多模態模型技術突破,AI的能力從未停止過增長的步伐。

與能力同步增長的,是指數級增長的資源需求。國際能源署(IEA)在1月發佈的報告中估計,2026年全球資料中心、人工智慧和加密貨幣行業的電力消耗可能會翻倍,大大高於未來三年全球其他電力需求增速。

如何更高效地支撐AI發展?同時提升效率和經濟效益?先天資源更集中,因此效率也更高的雲端運算顯然是唯一答案。

雖然趨勢已經非常明確,但隨著 PC 網際網路和移動網際網路時代的落幕,傳統的雲端運算架構開始顯得過時。特別是臨近AI時代,“新技術”和“新應用”提出了眾多的“新需求”和“新挑戰”,無一不在推動雲端運算行業從底層技術、關鍵元件到解決方案等多個層面進行全面的變革。

換言之,誰能夠在雲端運算行業中,最有遠見、最有規劃地搶先完成這一系列變革,就將在未來數年的雲端運算競賽中佔有先機。

對於這個重大挑戰和機遇,在網際網路時代一直走在行業最前列的亞馬遜雲科技,一直有著自己的想法。

在這周開幕的亞馬遜雲科技re:Invent 2024上,亞馬遜雲科技再次向全球展示了他們對於雲端運算、AI、產業和生態的最新見解,並且帶來了一系列足以改變行業發展軌跡的創新。

回顧雲端運算的發展歷史,雖然技術變革已經發生了數次,但基本邏輯萬變不離其宗——在不斷增強計算能力的同時,通過各種雲端運算技術,將這種能力靈活高效地提供給客戶。

而這一邏輯,也貫徹主題全面“AI化”的亞馬遜雲科技re:Invent 2024之中。


晶片+工具,打造最強計算力解決方案

亞馬遜雲科技去年在re:Invent上發佈了全新AI處理器Trainium2,在本屆大會上,這款產品終於走向了大規模實例應用。

為了發揮出這顆用於模型訓練的新晶片實力,亞馬遜雲科技本次還“祭出”了另外兩項創新:直接將晶片高速連接在一起的NeuronLink技術,和伺服器機架之間超高速互聯的“10p10u”(千台伺服器10Pb網路容量且延遲僅有10微秒)網路。

在它們的幫助下,Trainium2新實例展現出了極強的計算能力:

由16顆Trainium2驅動的EC2 Trn2 Instances實例,整體性價比對比目前GPU競品解決方案高30~40%;
由64顆Trainium2驅動EC2 Trn2 UltraServers實例,更是能提供高達83.2 FP8 Pflops的恐怖運算能力。

在打造出超強性能的同時,亞馬遜雲科技也拿出了充分釋放Trainium2這頭“性能猛獸”的新工具。

其一是全新的、讓開發者可以直接訪問晶片底層的Neuron Kernel Interface (NKl)介面。這款工具讓開發者可以對晶片進行最深層的偵錯和最佳化,以更經濟高效的方式建構AI應用程式。

另外一個是Amazon Bedrock新提供的“延遲最佳化推理選項”(Latency-optimized inference)。這個新功能通過進一步降低推理處理流程中的延遲,諸如Claude、Llama等基礎大模型在亞馬遜雲科技實例中的運行速度再次超過了其他雲端運算廠商。

得益於這一創新,Anthropic的Claude 3.5 Haiku基礎大模型的推理運行速度直接提升了60%,堪稱效果顯著。

這一比例也折射出了當前雲端計算能力發展的關鍵:廠商除了不斷應用更新更強的晶片,也需要在工具和解決方案環節加大投入,提升實際使用效果。

亞馬遜雲科技目前也正朝著這一方向努力,圍繞其Graviton4處理器、Trainium2訓練晶片、Inferentia2推理晶片、Nitro安全晶片等多款自研晶片,不斷打造更強大的實例、工具、解決方案,共同組成目前行業內最先進的計算力解決方案。


超越算力,打造下一代“雲端運算”

如果說打造足夠強大、好用的計算力已經很困難,那麼,如何將這些計算力轉化為AI應用解決方案和能力提供給客戶,才是雲端運算廠商進入AI時代的最大挑戰。

在今年早些時候,外媒對於今年新接任亞馬遜CEO的Matt Garman的採訪中,他曾提到:“我們不像很多競爭對手,選擇了退後一步,深入思考其客戶,無論是初創企業還是大型企業,如何能最好地將這項技術融入他們的應用程式,並利用他們自己的獨特資料。”

而這一思路給出的實際解決方案,就是本次大會上全新升級的兩款超級產品:為生成式AI全生命周期提供一站式服務的Amazon SageMaker和提供上百種業界領先大模型的Amazon Bedrock。

先說Amazon SageMaker發佈於2017年底,之前的定位一直是個基於雲端運算的機器學習服務。在過去Amazon SageMaker的主要功能被重新命名為Amazon SageMaker AI的基礎上,此次又引入了子產品Amazon SageMaker HyperPod,後者重點最佳化訓練過程中的效率問題。

包括能充分利用雲端峰谷資源來解決訓練時間和降低成本的Hyper Pod flexible training plans,以及最大化提升資源使用率,讓使用者可以即時監控效率的HyperPod Task Governance。

假如使用者本身希望調第三方AI應用,只要他們是亞馬遜雲科技的合作夥伴,就可以通過Amazon SageMaker AI實現呼叫,同時直接享受到亞馬遜雲科技諸多的技術和功能創新,實現效果的一步到位。

因為大模型的實際應用和實踐快速增長,Amazon Bedrock的創新顯得更加“密集”。

雖然目前各種基礎大模型眾多,但是企業內部為了保證大模型輸出的結果、自身資料的保密性,越來越傾向於使用自己的資料對基礎大模型進行二次訓練。

對此Amazon Bedrock就提供了兩個新功能:能夠快速蒸餾高效小尺寸模型的Model Distillation和能夠利用自動化推理檢查的 Automated Reasoning checks。

而有了這兩項新功能,企業不僅可以在更短的時間、更少成本的前提下訓練出自己的模型,還能同時主動應對模型幻覺,進一步提升模型的精準度,並且縮小模型體積。實現自有大模型一步到位的最佳化。

針對多樣化的推理場景,亞馬遜雲科技此次則帶來了企業AI應用解決方案poolside、高品質圖片生成Stable Diffusion 3.5和高品質視訊生成Luma Al等行業最領先的第三方大模型。

與這些關鍵大模型一起引入的,還有諸多其他從通用到專用的第三方模型,他們共同組成了全新的Amazon Bedrock Marketplace。使用者目前已經可以在這個平台上輕鬆呼叫超過100個大模型。

在大模型可用數量大幅增長的基礎上,亞馬遜雲科技還帶來了Amazon Bedrock Intelligent Prompt Routing和Amazon Bedrock multi-agent collaboration兩項創新,前者可以自動為Prompt提供最適合的模型,後者則可以在無需大量程式碼工作的前提下,將任務平行交給多個大模型完成。

打造完這一整套大模型能力解決方案的同時,亞馬遜雲科技也“順手”解決了使用者的資料需求:全新的Amazon Kendra Generative Al index連接了超過40個企業級資料來源,徹底掃除客戶打造AI應用過程中的資料難題。

GraphRAG是Amazon Bedrock Knowledge Base新增的另一項支援,它可以充分利用知識圖的特性來幫助模型生成更加相關的輸出。而對於大量非結構化的多模態資料,Amazon Bedrock Guardrails Multimodal toxicity detection這一新功能可以自動化將它們轉換為結構化資料,更好地服務AI和分析應用。

拋開這些創新的技術細節,亞馬遜雲科技此次對於Amazon SageMaker和Amazon Bedrock創新的數量之多、環節之全、投入之大,堪稱重磅。

這也充分反映出了當前雲端運算行業的機遇和挑戰,要想在AI時代發揮出雲端運算更多的能力,實現更多的成績,就必須結合實際使用者的需求,全方位最佳化和創新雲端運算的能力和解決方案。

用人話來說,就是要在網際網路時代已經“重塑”過雲端運算的基礎上,再次全方位“重塑”雲端運算。


重塑自己,“順手”重塑未來

在一個多月之前公佈的2024年第三季度財報中,亞馬遜不僅營收超預期、盈利遠超預期,亞馬遜雲科技 和廣告收入基本符合預期,且雲業務同比收入增幅有加速趨勢,四季度營業利潤的指引區間中位數更是高於市場預測。

整個成績可謂無懈可擊。也反應了當前亞馬遜雲科技在繼續力推雲服務的同時,全身心投入到“AI 軍備競賽” 這個選擇的正確性。

這一切成績的根源,最早可以追溯到亞馬遜雲科技前CEO Andy Jassy,其在2020年的分享:“重塑”,而且是堅持不懈地重塑。

亞馬遜雲科技現任CEO Matt Garman在採訪中也專門強調了:“客戶之所以選擇亞馬遜雲科技,是因為我們提供了最全面、最優秀的服務。人們之所以依賴我們,是因為我們在安全性和營運性能方面遙遙領先,並且我們幫助他們創新和快速發展。我們必須繼續推動這個發展路線圖。”

這種即便領先,依舊孜孜不倦引領行業創新,幫助客戶創造成功的信念,不僅推動著雲端運算產業的發展,也在塑造亞馬遜雲科技的未來。 (虎嗅APP)