首页
资讯
深度
投融资
政策
活动
视频
当前模式 菜单关闭
我们能帮忙找点什么吗?

英伟达开源Nemotron-70B模型,性能超越GPT-4o和Claude 3.5

发布日期:2024-10-22 13:31:43
字号:A+A-

编译 / VRAR星球 R星人


近日,英伟达开源了其最新的超强大模型——Nemotron-70B。一经发布,该模型便迅速在AI社区引发轰动,其性能在多个基准测试中超越了包括GPT-4、GPT-4 Turbo以及Claude 3.5 Sonnet在内的140多个开闭源模型,仅次于OpenAI的最新模型o1。

 


Nemotron-70B的基础模型是基于Llama-3.1-70B开发而成,并通过人类反馈强化学习进行了训练,特别是采用了“强化算法”。在训练过程中,英伟达使用了一种新的混合训练方法,包括Bradley-Terry和Regression在内的训练奖励模型,同时开源了训练数据集。该模型基于Llama-3.1-Nemotron-70B-Reward提供奖励信号,并利用HelpSteer2-Preference提示来引导模型生成符合人类偏好的答案。

 

网友们纷纷对Nemotron-70B进行了测试,发现该模型在处理复杂问题时表现出色。例如,在回答关于香蕉数量的问题时,Nemotron-70B能够准确地将问题所给信息进行分解,并一步一步推理得出正确答案。此外,在回答关于活到89岁的名人名单时,尽管模型将某人的去世日期弄错,但整体表现仍然令人印象深刻。


商务合作:13146398132undefined

媒体合作:13341147250

爆料投稿:editor@vrarworld.cn

版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。

如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。

本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

发表评论(0