【DeepSeek】剛剛！DeepSeek，重磅發佈！

2025/02/25

•

【導讀】市場震盪，DeepSeek開源FlashMLA

大家好啊，今天，A股、港股都陷入了震盪調整，一起看看發生了什麼。

小幅震盪調整

2月24日，A股市場全天震盪調整，創業板指領跌。截至收盤，滬指跌0.18%，深成指跌0.08%，創業板指跌0.67%。

市場共2778隻個股上漲，91隻個股漲停，2468隻個股下跌。

農業股集體走強，智慧農業、星光農機、東方集團漲停。消息面上，2025年中央一號檔案2月23日發佈，本次中央一號檔案首提“農業新質生產力”。

基建股表現活躍，北方國際、中工國際、北新路橋等漲停。

DeepSeek概念股震盪調整，航錦科技、浙文互聯跌停，每日互動、青雲科技跌超10%。

港股方面，恆生科技指數跌約0.8%。

消息面上，美東時間2月21日，白宮網站發佈“美國第一”投資政策備忘錄，宣佈將調整美投資政策，重點進一步限制與中國的雙向投資。中國商務部表示，在中國赴美投資方面，美針對中國投資加嚴安全審查，將嚴重打擊中國企業對美投資信心。希望美方為中國企業赴美投資提供公平、透明、穩定、可預期的營商環境。在美對華投資方面，美方將進一步採取更多限制措施，這是非常不合理的。有關措施一旦落地，會進一步扭曲兩國投資往來，對美自身也沒有好處。很多美國商協會和企業已經提出，美對華投資限制將導致美國企業將中國市場讓給其他競爭對手。

DeepSeek今日啟動開源周

首個開放原始碼庫為FlashMLA

2月24日，DeepSeek啟動“開源周”，首個開放原始碼的程式碼庫為FlashMLA——針對Hopper GPU最佳化的高效MLA解碼核心，專為處理可變長度序列而設計。據介紹，FlashMLA的靈感來自FlashAttention 2&3和cutlass項目。

其發佈有以下幾個重點內容：

FlashMLA是DeepSeek針對HopperGPU最佳化的高效型MLA（Multi-HeadLatentAttention，多頭潛在注意力）解碼核心，專為處理可變長度序列設計，已在生產環境中投入使用。

此項目是DeepSeek V2–V3系列大模型的重要技術創新，旨在通過最佳化解碼過程和KV快取來降低大語言模型的推理成本，同時提升響應速度和吞吐量。

FlashMLA在輝達H800 SXM5 GPU上測試時，能夠達到3000GB/s的記憶體頻寬和580TFLOPS的計算上限，這顯示出在記憶體訪問和計算效率上的顯著優勢。

目前發佈的版本支援BF16精度，並採用塊大小為64的分頁KV快取，確保在處理大模型推理任務時更加高效。

官方指出，FlashMLA的設計靈感部分來源於FlashAttention2&3以及輝達的CUTLASS項目，這表明該解碼核在高效注意力計算方面進行了針對性最佳化。

通過採用低秩分解等技術，FlashMLA在壓縮KVCache的同時仍保證了原有性能，能夠在降低記憶體需求的同時提升推理效率。

FlashMLA特別適用於需要處理長序列文字的應用，如聊天機器人、文件分析以及即時翻譯系統，能顯著降低延遲和資源佔用。

隨著該項目開源，未來有望整合到vLLM、Hugging Face Transformers或Llama.cpp等開源生態系統中，使得更多大語言模型（如LLaMA、Mistral、Falcon）能在相同硬體資源下獲得更高效的推理性能。

發佈的程式碼中包含內聯PTX程式碼，這種做法使得開發者可以更精細地控制GPU執行流程，進一步提升計算性能，並可能部分繞開輝達封閉生態的限制。

上周四，DeepSeek宣佈在這周舉辦“開源周”活動，並開源五個程式碼庫。

DeepSeek表示以完全透明的方式與全球開發者社區分享他們的研究進展，每日都有新內容解鎖，進一步分享新的進展，並將這一計畫定義為“Open Source Week”。DeepSeek表示，其線上服務中的建構模組已經被記錄、部署並進行了實際測試，希望分享的每一行程式碼都會變成強有力的勢能，加速行業發展處理程序。該團隊還稱，這個領域沒有像牙塔，只有純粹的車庫創業精神與社區共築的創新力量。 (中國基金報)