爆了!全球第二! DeepSeek發表最新大模型

昨晚,DeepSeek發布了最新的大模型,叫做DeepSeek-Coder-V2,而且正式開源了。這款模型號稱在程式碼和數學能力上超越了GPT-4-Turbo,結合DeepSeek「AI屆拼多多」的價格,DeepSeek-Coder-V2性價比超高!我試著用它回答Python開發量化策略相關的問題:

DeepSeek是中國頂級量化私募巨頭幻方量化旗下的AI大模型開發公司,這次發布的DeepSeek-Coder-V2採用了他們之前的DeepSeek-V2模型結構,總參數量達到了236B。在多個程式碼和數學名單上,DeepSeek-Coder-V2全球排名第二,僅次於最強的閉源模型GPT-4o和GPT-4-Turbo之間

就在上個月,,DeepSeek宣布開源第二代MoE大模型DeepSeek-V2。據介紹,該模型在性能上可以媲美GPT-4 Turbo,但價格卻只有GPT-4的百分之一,對廣大用戶來說,無疑是一個利好消息。 DeepSeek由知名量化私募幻方量化於2023年4月創立。和那些獲得大廠投資的中國AI新創公司不同,如月之暗面、智譜AI、Minimax和百川智能等,DeepSeek與科技巨頭並無直接關係。

除了在程式碼和數學能力上的頂尖表現,優於GPT4-Turbo、Cl aude3-Opus、Gemini-1.5Pro 和Codestral。 DeepSeek-Coder-V2在中國的通用能力方面也名列前茅。這個模型支援32K上下文,API價格也很親民,每百萬輸入tokens只需要1塊錢


這款模型有236B和16B兩種參數規模,都全面開源,免費商用。此外,DeepSeek也提供本地私有化部署服務,包括高效能伺服器、模型、軟體套件等,價格為每年45萬元。

現在,DeepSeek-Coder-V2已經在官網上線了,用戶可以永久免費對話,還可以透過開放平台使用最新的API。趕快去體驗一下吧!(開發者阿橙)