4 月 7 日消息,Meta 公司上周发布了一款名为 Maverick 的新旗舰 AI 模型,并在 LM Arena 测试中取得了第二名的成绩。然而,这一成绩的含金量却引发了诸多质疑。据多位 AI 研究人员在社交平台 X 上指出,Meta 在 LM Arena 上部署的 Maverick 版本与广泛提供给开发者的版本并不一致。

据悉,Meta 在其公告中明确提到,参与 LM Arena 测试的 Maverick 是一个“实验性聊天版本”。而根据官方 Llama 网站上公布的信息,Meta 在 LM Arena 的测试中所使用的实际上是“针对对话性优化的 Llama 4 Maverick”。这表明,该版本经过了专门的优化调整,以适应 LM Arena 的测试环境和评分标准。
然而,LM Arena 作为一项测试工具,其可靠性本身就存在一定的争议。尽管如此,以往 AI 公司通常不会对模型进行专门的定制或微调,以在 LM Arena 上获得更高的分数,至少没有公开承认过这种做法。
这种对模型进行针对性优化,然后只发布一个“普通版”的行为,给开发者带来了诸多困扰。因为这使得开发者难以准确预测该模型在特定场景下的实际表现。
目前,Meta 公司以及负责维护 LM Arena 的 Chatbot Arena 组织暂未对此做出回应。(新闻来源:IT之家)
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

影石Flow 2 系列大更新!解锁专属口袋AI摄影师

Monster Moon正式推出快节奏VR竞技场射击游戏《Marrow Marrow》

专注于虚拟主播业务的Brave E轮融资筹集超过80亿日元

大型VR射击游戏《Forefront》将于4月24日正式上线

妙音XR沉浸体验馆正式登陆邯郸万象汇

智能眼镜公司Innovative Eyewear公布一季度业绩,营收同比增长约78%

中国台湾公司奇景光电发布用于AR眼镜的高对比度LCoS微显示技术

夏普公司新推出的VR眼镜“Xrostella VR1”已启动众筹活动

豪鹏科技宣布完成对Rokid乐奇的战略投资

Meta宣布重组Reality Labs硬件部门

Viture联合创始人:公司正计划推出“隐形”AI眼镜,与Meta展开竞争

洛图科技:2025年中国智能眼镜市场的销售量达145万台,同比增长211%

苹果为Vision Pro拍摄沉浸式视频时曾发生坠机事故,致探险家身亡

德国公司Brainjo获得200万欧元融资,作为VR心理健康技术研发启动资金

中动联合携手中国电信,打造Disney AI/XR文创标杆项目

王者荣耀X上海天文馆梦幻联动!《星海奇航:梦境救援》XR互动剧北影节正式官宣

法国公司Engo推出engo3 AR运动眼镜,配备彩色HUD,兼容Garmin和Apple Watch

支付宝宣布华为AI眼镜支持看一下支付3步搞定 承诺被盗即赔