首页
资讯
深度
投融资
政策
活动
视频
当前模式 菜单关闭
我们能帮忙找点什么吗?

训练成本不到50美元,研究人员打造出媲美OpenAI o1的推理模型

发布日期:2025-02-07 15:05:26
字号:A+A-

编译 / VRAR星球 R星人


2月7日消息,据媒体报道,“AI教母”李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。

 

s1诞生标志着高效AI模型训练的新时代。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini2.0FlashThinkingExperimental提炼出来的。这种方法的核心在于如何有效地传递知识,使得小模型不仅具备大模型的推理能力,而且在资源消耗上表现得极为优越。

 


李飞飞团队的这一突破,不仅展现了技术的前瞻性,而且为更多科研机构和创业公司提供了借鉴的蓝本。同时,s1所展现出价格优势的背后,其实也反映了未来AI领域的一个重要趋势:大模型的训练和应用将愈发平民化。

 

此前DeepSeek发布一系列DeepSeek-R1模型,探索了将R1的推理能力蒸馏到更小模型中的潜力,通过知识蒸馏技术,成功将大模型的推理能力传递给小模型,实现了小模型在推理任务上的显著提升,引领了小模型的发展方向。(新闻来源:金融界)


商务合作:13146398132undefined

媒体合作:13341147250

爆料投稿:editor@vrarworld.cn

版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。

如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。

本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

发表评论(0