大型語言模型 (large language model; LLM) 的規模和複雜性日益增加,NVIDIA 宣布推出 NeMo Megatron 框架的更新內容,更新後可加快訓練速度達 30%。這些更新內容包括兩項開創性技術及一項超參數工具,用在任意 GP ...