#技術堆疊
給他堆上癮了!AMD發表新論文,探索L2快取堆疊方案,容量大增延遲更低
一招鮮WCCTech報導,AMD發表了一篇令人矚目的論文,題為《平衡延遲堆疊快取》,專利申請號為US20260003794A1。本文中,AMD披露了平衡延遲堆疊快取的技術,即堆疊快取系統包含第一個快取晶片和至少第二個快取晶片,且以堆疊排列排列,並與第一個快取晶片形成疊加。首先我們知道,AMD在當下時代能奪取最佳遊戲處理器這一名號,就是源自於3D V-Cache技術。這項技術在CCD - 核心計算晶片疊加了一層L3快取,第一代的3D V-Cache將快取層疊加在CCD上方,而到了銳龍9000系,AMD將快取層轉移到了CCD下方。通過額外的快取層封裝,整個處理器獲得了大量的額外L3快取。AMD的3D V-Cache或者被稱為X3D的解決方案已經從上至下應用在了EPYC霄龍資料中心處理器和消費級的銳龍處理器系列上。而在AMD繼續開發L3 3D V-Cache技術的同時,也在探索更多方法來堆疊更多快取,而本次談到的L2堆疊就是AMD的新項目。根據AMD論文中提供的示意圖,我想大概是這樣,在CCD的Basedie上會有一顆晶片兩層封裝的L2 3D V-Cache,而在核心與L2的位置(也是CCX,計算核心複合體),則會有一顆晶片一層封裝的L2 3D V-Cache。而對於其堆疊的L2快取設計,AMD也展示了一個包含四個512KB區域的快取模組,總共可提供2MB的L2快取,以及一個CCC(快取控制電路)。這一L2快取複合體可根據需要進行擴展部署,框圖中展示了最多4MB的方案。本質堆疊方式還是和現有的3D V-Cache一致,將L2/L3堆疊層連接到Basedie和CCX,採用矽通孔技術進行配置。而如圖,該方案由兩個快取晶片組成,CCC負責控制資料的輸入輸出。論文中,AMD以平面1MB L2和2MB L2快取配置為例,作者指出,1MB L2M快取在平面配置下典型延遲為 14 周期,而堆疊 1MB L2M 快取延遲為 12 周期。這表明堆疊L2快取不僅能提供更高容量,還能實現與典型平面方法相當甚至更好的周期延遲。在所述技術的相關方案中,堆疊快取系統的配置減少了訪問堆疊快取時的響應延遲,並提供了節能特性。該堆疊快取系統提升了資料傳輸性能,其延遲低於建構在單個裸片(Die)上的傳統平面快取。值得注意的是,連接通孔(Vias)被佈置在堆疊快取系統的中心進出。這避免了像傳統平面快取那樣,為了將資料跨越快取的一部分傳輸到遠離資料介面(I/O)的區域而必須增加布線級(本文中也稱為流水線級)。在所述技術中,路由至堆疊快取系統中心的連接通孔,在堆疊裸片(例如第一快取裸片與至少第二快取裸片)上的兩個快取半部之間建立了均衡(或一致)的延遲。例如,傳統的 1 MB 平面 L2M 快取具有 14 個周期的延遲,而採用所述技術實現的 1 MB 堆疊 L2M 快取僅有 12 個周期的延遲。這使得在實現比典型平面快取容量更大的堆疊快取時,仍能達到相同甚至更優的周期延遲。因此,所述均衡延遲堆疊快取的各個方面降低了訪問請求的延遲,使資料從資料快取中返回的速度更快。由於訪問請求在更少的周期內完成,二級(L2)快取等元件的開啟時間縮短,從而實現了功耗節省;同時,快取能夠更早地從活躍狀態轉入空閒狀態,也帶來了額外的節能效果。此外,快取裸片內的布線長度更短,有效降低了電容並節省了功耗。由於訊號在處理訪問請求和資料返回時僅需傳輸一半的距離,訊號負載也隨之減小。進一步地,得益於功耗降低、電容減小以及訊號傳輸距離縮短,系統產生的熱量也相應減少。——AMD Balanced Latency Stacked Cache(Google論文)作者還表示,堆疊式L2快取不僅有更好的延遲表現, 還能節省電量。顯然我們還有相當的時間才能看到堆疊L2快取才能在實際晶片上發揮作用,但與堆疊式 L3 3D V-Cache 一樣,我們有充分的理由相信我們將看到它整合在 AMD 未來的晶片中,無論是 CPU 還是顯示卡。這種 L2 堆疊技術對伺服器領域(EPYC 處理器)和專業開發人員的價值遠大於普通家用辦公。它能有效填補一級快取與三級快取之間的巨大性能鴻溝,使處理器在處理複雜邏輯、非線性資料結構時表現得像“資料就在核心旁邊”一樣順暢。同時,遊戲雖然平均幀依賴L3容量,但是更快更大的L2快取,也將顯著改善最低幀 (1% Low FPS),減少微卡頓——這也將真正改寫銳龍處理器的體驗。 (AMP實驗室)
RWA流動性池的技術鐵三角
流動性可信度 = IPFS存證不可刪 +預言機驗證不可假 + 跨鏈協議不可阻🔐一、IPFS+雜湊上鏈:把資料烙上“永恆鋼印”傳統痛點紙質倉單被篡改、Excel資料可隨意覆蓋 → 融資欺詐頻發RWA解決方案冷鏈存證四步鎖死:示例跨境藥品案例:疫苗運輸資料每30分鐘生成PDF → 存入IPFS雜湊值上鏈並與物聯網原始資料比對(誤差率<0.01%)關鍵優勢:篡改成本極高:需同時攻破IPFS節點+區塊鏈+物聯網系統司法效力:司法採納IPFS雜湊作為電子證據🔗二、預言機機制:實體世界與鏈上的“神經導管”分層驗證設計(防單點作惡)智能合約雙觸發邏輯:🌉三、跨鏈互通:打破資產孤島的“液壓錘”跨境流動性橋技術堆疊:資產對應層:Wormhole NTT(原生代幣轉移)協議合規通道:數位人民幣(e-CNY)結算閘道器流動性路由:基於CoW Swap的跨鏈AMM關鍵突破:⏱️ 跨境轉讓從3個月→8分鐘💸 手續費從12%→0.7%🔒 外管局即時監控資金流💊實戰樣板:跨境醫藥RWA流動性池資產包:真實資產的倉庫(估值$1.8億)儲存疫苗/生物製劑,溫控要求2-8℃技術架構:流動性池效益:⚠️三重災備機制(防技術崩潰)1.預言機降級方案主網資料異常 → 自動切換備用預言機(如從國電網切至氣象衛星)2.跨鏈斷網保險通道中斷 → 資產自動鎖定,啟動境內備用AMM池3.PFS冗餘儲存全球分佈式節點(含政務雲)防資料丟失💎 技術鐵三角的金融本質. IPFS+雜湊上鏈 → 把物理世界變成不可篡改的財務帳本. 預言機 → 讓冷庫溫度、太陽能發電成為自動觸發金融行為的開關. 跨鏈協議 → 在監管框架內建造全球流動性的地下隧道三者合一,RWA才真正從“不動產”進化為“超流體資產”。 (二小文的書架)
AGI的秘密已被破解?OpenAI前研究主管的驚人預言
6月17日紅杉資本Training Data的播客邀請到Bob McGrew深談。作為OpenAI前研究主管,McGrew曾與Ilya Sutskever、Anthropic創始人Dario Amodei等一起制定roadmap,見證了GPT-3的歷史性突破,深度參與了從GPT-3到GPT-4的技術演進,他是推動OpenAI從研究實驗室向商業巨頭轉型的關鍵人物,更是少數幾個真正理解當前AI技術全貌的內部人士。在訪談中,這位見證了AI發展史上最重要時刻的技術領袖,拋出了一個觀點:"如果你在2035年回頭看,會發現我們今天已經掌握了創造通用人工智慧(AGI)的所有基礎概念,我認為即使在2035年,我們也不會看到任何新的趨勢。"“AGI所需的核心技術堆疊(預訓練、後訓練、推理)已經成熟,2035年前不會出現新的基礎範式”“2025是推理之年”“AIAgents將因算力成本趨零而實現低價化”“機器人技術迎來拐點”一、AGI技術堆疊的三駕馬車McGrew描繪了一個完整的AGI技術堆疊,他稱之為"三駕馬車":預訓練、後訓練、推理。這三個環節構成了現代AI系統的完整開發流程,構成了通向AGI的完整路徑。預訓練(pre-training):規模化的基礎"預訓練仍然重要,但已經進入收益遞減期。"McGrew指出,模型的智能水平與投入的算力呈對數線性關係——每次智能的顯著提升都需要指數級的算力投入。一個巨大的訓練過程,需要消耗所有的資料中心,預訓練下一個模型時,需要新的資料中心,則需要更漫長的時間。這解釋了為什麼各大AI公司都在瘋狂擴大訓練規模,但同時也預示著純粹的算力軍備競賽將逐漸失去意義。後訓練(post-training):性格塑造的藝術預訓練和推理都有一個非常清晰的縮放定律(Scaling Law),你投入更多的計算,就能獲得更高的智能,而後訓練則不同,後訓練是關於模型個性的。"後訓練關於模型性格。"這個階段的重要性正在日益凸顯。有趣的是,McGrew透露這項工作往往由產品經理等級的人員而非研究科學家來完成,說明AI開發正在從純技術驅動轉向產品和使用者體驗驅動。這是一個需要大量人類審美判斷和行為設計的過程。推理(reasoning):2025年的關鍵戰場“思維鏈Chain-of-Thought(CoT)”是最近兩年最重要的突破。McGrew特別提到了GPT-4(o3)相比GPT-3.5(o1-preview)的關鍵差異:"o1-preview無法使用工具,而o3可以將外部工具納入思考鏈。"這種將推理與工具呼叫結合的能力,讓AI從"回答問題"進化為"解決問題"。McGrew對2025年有一個明確的預測:2025將是"推理之年"。他觀察到一個有趣的發展軌跡:從去年9月的o1-preview到今年的o3,推理能力的進步速度正在從"隔月升級"轉向"半年升級"。這种放緩並非技術停滯,而是說明推理技術正在走向成熟。更重要的是,推理技術正在從OpenAI擴散到整個行業。Google DeepMind、Anthropic等公司都在快速跟進,這將推動整個AI生態系統向更高層次的問題解決能力演進。二、智能體(AI Agents)與經濟模式重構McGrew預測了一個顛覆性的經濟趨勢:智能體的定價將趨向於算力成本的機會成本。這個看似技術性的判斷,實際上預示著整個服務經濟的重構。傳統服務業的顛覆想像一下,當AI律師的成本接近算力成本時,傳統律師服務會發生什麼?McGrew認為,那些主要依賴知識處理和標準化流程的職業將面臨根本性的價格重構。這不僅是效率的提升,更是商業模式的革命。創業機會的新地圖但McGrew也指出了希望所在:真正的創業機會集中在具有網路效應、需要人類深度互動的領域。企業級服務、個性化諮詢、複雜的多方協調——這些需要深度理解人類情感和社會關係的領域,仍然是人類的主場。"應用公司需要網路效應、品牌價值、規模經濟來建構護城河。"McGrew強調,單純的技術能力不再是競爭壁壘,真正的價值在於如何將AI能力嵌入到具體的業務場景中。三、資料價值的範式轉移McGrew揭示了一個令人震驚的趨勢:專有資料的優勢正在被AI的"無限耐心"所削弱。專有資料優勢的消解他舉了一個生動的例子:特斯拉花費巨資收集的Autopilot駕駛資料,現在可以通過AI模擬大部分場景來復現。"AI可以通過公共資料加上無限的耐心和嘗試,復現很多我們認為需要專有資料才能獲得的價值。"這個觀點顛覆了許多人對資料護城河的認知。那些花費巨資收集資料的公司可能會發現,他們的資料優勢正在被AI的生成和推理能力所消解。新的稀缺資源那麼什麼資料還有價值?McGrew指出了兩類真正稀缺的資料:1. 個性化資料:如財務顧問對特定客戶的深度理解、醫生對患者的長期觀察記錄2. 場景化流程知識:特定行業、特定企業的業務流程細節和最佳化經驗這些資料的價值在於其不可複製性和高度個性化特徵。四、機器人技術的破局時刻McGrew對機器人技術的突破有著獨特的洞察。他認為,大語言模型為機器人提供了自然語言任務介面,降低了任務定義成本,以及視覺編碼的技術突破,共同構成了機器人技術的關鍵驅動,推動機器人從單一任務向通用任務擴展。從單一任務到通用任務McGrew舉了一個對比鮮明的例子:過去OpenAI花費數年時間教機器人解決魔方這一個任務,而現在像Physical Intelligence這樣的公司只需要幾個月就能讓機器人學會洗衣服、摺疊紙箱、整理蛋托等多種任務。這種飛躍的背後是技術堆疊的根本性變化:機器人不再需要為每個任務重新訓練,而是可以基於預訓練的大模型進行快速適應。商業化的時間窗口"因為他們站在了現有前沿模型的肩膀上。"McGrew指出,這種技術復用大幅縮短了機器人應用的開發周期,從傳統的十年周期壓縮到數月。這意味著機器人技術正在從實驗室走向商業應用的臨界點。那些能夠快速將通用AI能力轉化為特定場景解決方案的公司,將在這一輪變革中佔得先機。五、未來挑戰與應對教育革命:孩子需要理解的三件事作為三個孩子的父親,McGrew對AI時代的教育有著深刻的思考。他認為孩子們需要理解幾件核心的事情:1. AI是工具,不是朋友:"他花很多時間與ChatGPT交流,但他知道這不是他的朋友,而是一個他可以交談的專家。"這種認知邊界對於健康的AI使用至關重要。2. 學習的最佳時機:McGrew引用了教育學的一個重要原理:"當有人提出問題時,正是他們準備學習的時候。"AI的價值在於能夠在孩子產生好奇心的那一刻,提供即時、詳盡、個性化的解答。3. 掌握的核心能力:“第一,學習和解決問題的過程,這就是數學、論文寫作和程式設計的價值所在。這有點像學習的過程。第二,對項目有想法,並且相信自己可以做到,並且有能力使用任何可用的工具來解決問題,所以,這就是自主權。”只有具備了這些基礎能力,AI才能真正成為增強學習的工具。管理哲學:以員工利益為導向在談到如何管理這麼一群“天才型”團隊成員時,McGrew的核心原則是:"始終以員工的最佳利益為重"。OpenAI的人才留存策略無論是項目分配、團隊首發,還是艱難的解僱決定,McGrew都主張從"對方的最優利益"出發。這種理念在OpenAI的人才留存上體現得尤為明顯——即使在激烈的人才爭奪戰中,這種以人為本的管理方式也能建立真正的忠誠度。協作的藝術與挑戰但McGrew也坦誠地承認,管理天才型員工是一個巨大的挑戰。"如何平衡天才型員工的自我意志與團隊目標",這個問題在AI公司中尤為突出。他的解決方案是消除人為的職能隔閡。在組織架構上,他推崇將"研究者vs工程師"統一為"技術團隊成員"(Member of Technical Staff),促進跨職能協作。這種做法已經在OpenAI、Anthropic等領先的AI公司中成為標準。McGrew的觀點無疑是大膽且具有爭議性的。如果他的判斷可靠,那我們可能比想像中更接近這個歷史性的時刻。McGrew自己也承認:"我有點希望我是錯的。"如果基礎性突破已經完成,那麼競爭的焦點將轉向工程實現、產品創新和商業應用。AGI技術堆疊已進入精細化打磨階段,核心突破轉向推理能力最佳化與多模態融合。經濟價值將嚮應用層遷移,具備網路效應、個性化服務的企業更具生命力。機器人技術因語言介面革新迎來商業化拐點,而資料與算力的壟斷壁壘正在瓦解。未來十年,AGI發展將圍繞現有範式的效率提升展開,而非基礎理論突破。如McGrew所言:"如果有什麼事情人類能做到,而你無法讓模型做到,那是你的問題。" (JER學家)