NVIDIA今天宣布推出全新的AI軟體,稱為TensorRT LLM,可提高GPU上的大型語言模型性能。 NVIDIA表示他們正在與所有領先的推理工作負載(例如Meta、Grammarly、Deci、anyscale 等)合作,使用TensorRT-LLM加速他們 ...