#蒸餾模型
2025/01/30
•
【DeepSeek】關於DeepSeek,你需要知道的8件事
Key Points DeepSeek單周下載量高達約240萬次,可能超過豆包在前一年春節期間通過廣告投放達到的下載量; 引發美股大跌的是兩個模型DeepSeek-V3和DeepSeek-R1,前者是類4o模型,後者是類o1模型; DeepSeek-V3訓練成本只有Llama 3的1%,DeepSeek-R1推理成本只有OpenAI o1的3%;