登入
關鍵字
#FlashAttention三代
官方認證
RexAA
2024/07/12
•
H100利用率飆升至75%!輝達親自下場FlashAttention三代升級,比標準注意力快16倍
大模型訓練推理神作,又更新了! 主流大模型都在用的FlashAttention,剛剛升級第三代。 時隔一年,FlashAttention-3已經全方位升級。 訓練速度提升1.5-2倍,FP16下計算吞吐量高達740TFLOPs/s,達理論最大吞吐量75%,更充分利用計算資源,此前只能做到35%。
#輝達
#FlashAttention三代
212人
讚
留言
分享