今天NVIDIA悄悄開源了名為Nemotron-70B的AI模型。這款模型一經發布便在多個測試中超越了包括OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet在內的140多個開閉源模型,僅次於OpenAI的最新模型o1。
對此AI社群驚呼,新的開源王者又來了?業界更是表示用Llama 3.1訓出小模型吊打GPT-4o,簡直是神來之筆。
從命名上可以看出Nemotron-70B採用Llama-3.1-70B開發,在沒有專門提示和額外推理token的情況下,Nemotron-70B也能答對複雜的推理問題,如草莓有幾個r的經典難題。
業內人士評價NVIDIA在Llama 3.1基礎上訓練出的這個不太大模型,能夠超越GPT-4o和Claude 3.5 Sonnet,是一次技術上的飛躍。目前Llama-3.1-Nemotron-70B-Instruct已經可以在線上體驗。
此外NVIDIA也開源了Nemotron的訓練資料集HelpSteer2,包含如下:
打造了21362個提示反應,使模型更符合人類偏好,也更有幫助、更符合事實、更連貫,並且可以根據複雜度和詳細度進行客製化;打造了20324個用於訓練的提示反應,1038個用於驗證。
消息來源
|