#Nemotron-4
2024/03/02
•
輝達最強通用大模型Nemotron-4登場!15B擊敗62B,目標單張A100/H100可跑
【新智元導讀】許久未更新大模型的輝達推出了150億參數的Nemotron-4,目標是打造一個能在單一A100/H100可跑的通用大模型。 最近,輝達團隊推出了全新的模型Nemotron-4,150億參數,在8T token上完成了訓練。 值得一提的是,Nemotron-4在英語、多語言和編碼任務方面令人印象深刻。 論文網址:https://arxiv.org/abs/2402.16819