4 月 7 日消息,Meta 公司上周发布了一款名为 Maverick 的新旗舰 AI 模型,并在 LM Arena 测试中取得了第二名的成绩。然而,这一成绩的含金量却引发了诸多质疑。据多位 AI 研究人员在社交平台 X 上指出,Meta 在 LM Arena 上部署的 Maverick 版本与广泛提供给开发者的版本并不一致。

据悉,Meta 在其公告中明确提到,参与 LM Arena 测试的 Maverick 是一个“实验性聊天版本”。而根据官方 Llama 网站上公布的信息,Meta 在 LM Arena 的测试中所使用的实际上是“针对对话性优化的 Llama 4 Maverick”。这表明,该版本经过了专门的优化调整,以适应 LM Arena 的测试环境和评分标准。
然而,LM Arena 作为一项测试工具,其可靠性本身就存在一定的争议。尽管如此,以往 AI 公司通常不会对模型进行专门的定制或微调,以在 LM Arena 上获得更高的分数,至少没有公开承认过这种做法。
这种对模型进行针对性优化,然后只发布一个“普通版”的行为,给开发者带来了诸多困扰。因为这使得开发者难以准确预测该模型在特定场景下的实际表现。
目前,Meta 公司以及负责维护 LM Arena 的 Chatbot Arena 组织暂未对此做出回应。(新闻来源:IT之家)
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

肖特扩大在华投资,智能眼镜全系列AR光学方案正式亮相

宝可梦进军美国奥兰多环球影城,全新主题园区将结合AR捕捉+现实对战

肯尼亚外包工揭露Meta智能眼镜数据内幕:让你的日常生活彻底“裸奔”

雷鸟创新携手德国电信亮相MWC 2026,推出首款代理式AI智能眼镜

2025年中国智能眼镜市场的销量为145.4万台,同比大涨211%

TWS乐队的首部VR演唱会影片在曼谷、中国香港等地上映

Praydog发布《生化危机:安魂曲》PC VR模组

Loft Dynamics、EASA和空客直升机在尼泊尔启动VR飞行员培训项目

炬芯科技:公司芯片已应用于INMO、Halliday、形意智能三款AI眼镜产品中

肯尼亚外包工揭露Meta智能眼镜数据内幕:让你的日常生活彻底“裸奔”

雷鸟创新携手德国电信亮相MWC 2026,推出首款代理式AI智能眼镜

2025年中国智能眼镜市场的销量为145.4万台,同比大涨211%

鲸鸣视控推出A控儿童智能眼镜·芯生代系列,以AI科技助力儿童视力健康主动管理

慧明眼镜集团首发人工智能配镜终端,向全球展示未来视光服务“中国方案”

北京同创蓝天云科技推出“酷雷曼VR内容一体机”

《Beat Saber》加入Horizon Plus订阅服务,但DLC仍需付费购买

Meta首席技术官:VR游戏“摇钱树”时代已经结束,客户获取才是真正的难题

北京市门头沟区发布AI+微短剧三年行动计划,XR沉浸视听联合实验室揭牌