爆了！全球第二！ DeepSeek發表最新大模型

2024/06/18

•

昨晚，DeepSeek發布了最新的大模型，叫做DeepSeek-Coder-V2，而且正式開源了。這款模型號稱在程式碼和數學能力上超越了GPT-4-Turbo，結合DeepSeek「AI屆拼多多」的價格，DeepSeek-Coder-V2性價比超高！我試著用它回答Python開發量化策略相關的問題：

DeepSeek是中國頂級量化私募巨頭幻方量化旗下的AI大模型開發公司，這次發布的DeepSeek-Coder-V2採用了他們之前的DeepSeek-V2模型結構，總參數量達到了236B。在多個程式碼和數學名單上，DeepSeek-Coder-V2全球排名第二，僅次於最強的閉源模型GPT-4o和GPT-4-Turbo之間。

就在上個月，，DeepSeek宣布開源第二代MoE大模型DeepSeek-V2。據介紹，該模型在性能上可以媲美GPT-4 Turbo，但價格卻只有GPT-4的百分之一，對廣大用戶來說，無疑是一個利好消息。 DeepSeek由知名量化私募幻方量化於2023年4月創立。和那些獲得大廠投資的中國AI新創公司不同，如月之暗面、智譜AI、Minimax和百川智能等，DeepSeek與科技巨頭並無直接關係。

除了在程式碼和數學能力上的頂尖表現，優於GPT4-Turbo、Cl aude3-Opus、Gemini-1.5Pro 和Codestral。 DeepSeek-Coder-V2在中國的通用能力方面也名列前茅。這個模型支援32K上下文，API價格也很親民，每百萬輸入tokens只需要1塊錢。

這款模型有236B和16B兩種參數規模，都全面開源，免費商用。此外，DeepSeek也提供本地私有化部署服務，包括高效能伺服器、模型、軟體套件等，價格為每年45萬元。

現在，DeepSeek-Coder-V2已經在官網上線了，用戶可以永久免費對話，還可以透過開放平台使用最新的API。趕快去體驗一下吧！(開發者阿橙)