#In-Flight
2023/09/10
•
H100推理飆升8倍!輝達官宣開源TensorRT-LLM,支持10+模型
【新智元導讀】 H100讓模型推理性能最高躍升8倍!英偉達最新開源軟件TensorRT-LLM,將徹底改變LLM推理現狀。 「GPU貧民」即將告別困境! 剛剛,英偉達發布了一款開源軟件TensorRT-LLM,能夠加速H100上大型語言模型的推理。 那麼,具體能提升多少倍?