NVIDIA的HGX H200 AI加速器憑藉NVIDIA獨家解碼演算法Medusa ,在Llama 3.1推理方面獲得大幅提升。 [新聞稿]:隨著大型語言模型 (LLM) 的規模和複雜性不斷增長,多GPU運算是提供即時產生AI應用程式所需的低延遲和高 ...