首页
资讯
深度
投融资
政策
活动
视频
当前模式 菜单关闭
我们能帮忙找点什么吗?

DeepSeek或提前发布R2模型

发布日期:2025-02-27 16:01:22
字号:A+A-

编译 / VRAR星球 R星人


2月25日,据路透社报道,DeepSeek计划提前发布其新一代AI模型R2。据知情人士透露,R2原定于5月初发布,但现在公司希望尽快推出。DeepSeek表示,新模型将在编程能力和多语言推理方面有所提升。对于R2 的发布时间表,没有提供具体细节。

 


印度技术服务提供商Zensar的首席运营官Vijayasimha Alilughatta表示:“DeepSeek的R2模型发布可能会成为AI行业的一个关键时刻。DeepSeek成功打造了具有高性价比的AI模型,将促使全球公司加速研发进程,打破目前由几家主导企业垄断的格局。”

 

对此,幻方量化相关人士回复券商中国记者,“以官方消息为准。”

 

此前,有行业人士在Reddit中发帖表示,DeepSeek-R1在编码和SWE-Bench方面已经与OpenAI匹敌,甚至没有使用他们最大的突破——强化学习 (RL),这种情况即将改变。

 

“他们正在解决这个问题。未来版本将集成拒绝采样和异步评估,使强化学习可用于软件工程。路线图非常清晰:DeepSeek-R2将是一次优化飞跃,而不是算法飞跃。如果说DeepSeek证明了什么,那就是他们解决优化问题的能力。”

 

据知情人士透露,DeepSeek前员工表示,公司的成功主要归功于梁文锋专注于更具成本效益的AI架构。DeepSeek采用了混合专家(MoE)和多头潜在注意力(MLA)等技术,大大降低了计算成本。

 

此外,DeepSeek API开放平台今日也宣布重新开启API充值服务。此前,由于服务器资源紧张,该平台曾在2月6日暂停了API服务的充值功能。(新闻来源:券商中国)


商务合作:13146398132undefined

媒体合作:13341147250

爆料投稿:editor@vrarworld.cn

版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。

如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。

本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

发表评论(0