#AI應用領域
2025/02/13
•
【DeepSeek】AI技術創新,DeepSeek之外的應用側新敘事
越是建立在“應用大模型”基礎上的AI應用,理論上就越有機會成功跑出。 2025年的春節假期剛剛過去,但是DeepSeek引發的衝擊波仍然餘溫未散。 通過FP8訓練、多詞元預測、改良MOE架構、多頭潛在注意力機制(MLA)、無SFT強化學習等方法,DeepSeek-V3以極低的訓練成本實現了超越Qwen2.5-72B和Llama-3.1-405B等頂尖開源模型和部分閉源模型的性能,DeepSeek-R1更是表現出了超越OpenAI o1的推理效果。 DeepSeek系列模型的成功,為原來以算力為核心邏輯驅動的大模型行業開闢了新的道路,讓全球的基礎型大模型邁上了一個嶄新的台階。