【DeepSeek】剛剛!DeepSeek,重磅發佈!

【導讀】市場震盪,DeepSeek開源FlashMLA

大家好啊,今天,A股、港股都陷入了震盪調整,一起看看發生了什麼。

小幅震盪調整

2月24日,A股市場全天震盪調整,創業板指領跌。截至收盤,滬指跌0.18%,深成指跌0.08%,創業板指跌0.67%。


市場共2778隻個股上漲,91隻個股漲停,2468隻個股下跌。


農業股集體走強,智慧農業、星光農機、東方集團漲停。消息面上,2025年中央一號檔案2月23日發佈,本次中央一號檔案首提“農業新質生產力”。




基建股表現活躍,北方國際、中工國際、北新路橋等漲停。



DeepSeek概念股震盪調整,航錦科技、浙文互聯跌停,每日互動、青雲科技跌超10%。


港股方面,恆生科技指數跌約0.8%。


消息面上,美東時間2月21日,白宮網站發佈“美國第一”投資政策備忘錄,宣佈將調整美投資政策,重點進一步限制與中國的雙向投資。中國商務部表示,在中國赴美投資方面,美針對中國投資加嚴安全審查,將嚴重打擊中國企業對美投資信心。希望美方為中國企業赴美投資提供公平、透明、穩定、可預期的營商環境。在美對華投資方面,美方將進一步採取更多限制措施,這是非常不合理的。有關措施一旦落地,會進一步扭曲兩國投資往來,對美自身也沒有好處。很多美國商協會和企業已經提出,美對華投資限制將導致美國企業將中國市場讓給其他競爭對手。

DeepSeek今日啟動開源周

首個開放原始碼庫為FlashMLA


2月24日,DeepSeek啟動“開源周”,首個開放原始碼的程式碼庫為FlashMLA——針對Hopper GPU最佳化的高效MLA解碼核心,專為處理可變長度序列而設計。據介紹,FlashMLA的靈感來自FlashAttention 2&3和cutlass項目。


其發佈有以下幾個重點內容:

FlashMLA是DeepSeek針對HopperGPU最佳化的高效型MLA(Multi-HeadLatentAttention,多頭潛在注意力)解碼核心,專為處理可變長度序列設計,已在生產環境中投入使用。

此項目是DeepSeek V2–V3系列大模型的重要技術創新,旨在通過最佳化解碼過程和KV快取來降低大語言模型的推理成本,同時提升響應速度和吞吐量。

FlashMLA在輝達H800 SXM5 GPU上測試時,能夠達到3000GB/s的記憶體頻寬和580TFLOPS的計算上限,這顯示出在記憶體訪問和計算效率上的顯著優勢。

目前發佈的版本支援BF16精度,並採用塊大小為64的分頁KV快取,確保在處理大模型推理任務時更加高效。

官方指出,FlashMLA的設計靈感部分來源於FlashAttention2&3以及輝達的CUTLASS項目,這表明該解碼核在高效注意力計算方面進行了針對性最佳化。

通過採用低秩分解等技術,FlashMLA在壓縮KVCache的同時仍保證了原有性能,能夠在降低記憶體需求的同時提升推理效率。

FlashMLA特別適用於需要處理長序列文字的應用,如聊天機器人、文件分析以及即時翻譯系統,能顯著降低延遲和資源佔用。

隨著該項目開源,未來有望整合到vLLM、Hugging Face Transformers或Llama.cpp等開源生態系統中,使得更多大語言模型(如LLaMA、Mistral、Falcon)能在相同硬體資源下獲得更高效的推理性能。

發佈的程式碼中包含內聯PTX程式碼,這種做法使得開發者可以更精細地控制GPU執行流程,進一步提升計算性能,並可能部分繞開輝達封閉生態的限制。

上周四,DeepSeek宣佈在這周舉辦“開源周”活動,並開源五個程式碼庫。

DeepSeek表示以完全透明的方式與全球開發者社區分享他們的研究進展,每日都有新內容解鎖,進一步分享新的進展,並將這一計畫定義為“Open Source Week”。DeepSeek表示,其線上服務中的建構模組已經被記錄、部署並進行了實際測試,希望分享的每一行程式碼都會變成強有力的勢能,加速行業發展處理程序。該團隊還稱,這個領域沒有像牙塔,只有純粹的車庫創業精神與社區共築的創新力量。 (中國基金報)