6 月 6 日,深圳市政府披露的一則消息在半導體領域引起關注,也被《南華早報》報導——一支以華為為核心的聯合研究團隊,用至少 1000 顆昇騰 910C 晶片組成的叢集,完成了對深度求索(DeepSeek)V4‑Pro 模型的全參數後訓練。該模型的參數規模達 1.6 兆,預訓練語料庫超過 32 兆個 token。
這是中國本土 AI 加速器首次被公開證實能夠處理此量級的訓練類工作負載。過去,中國的 AI 公司在“訓練”這一環節幾乎完全受制於輝達 GPU,即便在推理側已能替代一部分。而“後訓練”,處於預訓練和部署之間,此前一直是未被跨越的難關。
但該消息未給出任何基準測試、執行階段長,也未提及與輝達的效率對比。背後的張力,自始至終都未曾減弱。
從“困境”走向“可行”