4 月 7 日消息,Meta 公司上周发布了一款名为 Maverick 的新旗舰 AI 模型,并在 LM Arena 测试中取得了第二名的成绩。然而,这一成绩的含金量却引发了诸多质疑。据多位 AI 研究人员在社交平台 X 上指出,Meta 在 LM Arena 上部署的 Maverick 版本与广泛提供给开发者的版本并不一致。

据悉,Meta 在其公告中明确提到,参与 LM Arena 测试的 Maverick 是一个“实验性聊天版本”。而根据官方 Llama 网站上公布的信息,Meta 在 LM Arena 的测试中所使用的实际上是“针对对话性优化的 Llama 4 Maverick”。这表明,该版本经过了专门的优化调整,以适应 LM Arena 的测试环境和评分标准。
然而,LM Arena 作为一项测试工具,其可靠性本身就存在一定的争议。尽管如此,以往 AI 公司通常不会对模型进行专门的定制或微调,以在 LM Arena 上获得更高的分数,至少没有公开承认过这种做法。
这种对模型进行针对性优化,然后只发布一个“普通版”的行为,给开发者带来了诸多困扰。因为这使得开发者难以准确预测该模型在特定场景下的实际表现。
目前,Meta 公司以及负责维护 LM Arena 的 Chatbot Arena 组织暂未对此做出回应。(新闻来源:IT之家)
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

舜宇光学19亿“联姻”歌尔光学,加速AI/AR光学赛道整合

谷歌发布会透露:三款智能眼镜待发布,2027年将发布双目显示版

为Gemini AI装上“眼睛”:谷歌与XREAL联合发布Project Aura

特斯拉Optimus机器人演示时摔倒手忙脚乱“摘VR头显”,暴露并非完全AI驱动

《黑袍纠察队》官方VR衍生游戏《触发警告》宣传片公开

AStation将于12月16日举办第二届技术分享会

科技赋能文旅融合:影核签约云南,共建XR大空间数字体验新阵地

昀光科技完成A轮融资 正式启动12英寸硅基OLED产线建设

Meta收购超2.3亿元融资AI硬件公司

为Gemini AI装上“眼睛”:谷歌与XREAL联合发布Project Aura

全黑色苹果Vision头显部件曝光,或为Vision Air设计

扎克伯格官宣!苹果前VP执掌Meta AI硬件新部门

Meta收购超2.3亿元融资AI硬件公司

全球首款8K全景无人机,影石影翎A1开售首日国内销售额超2000万

《恐惧子午线》在1月发售前公布多人游戏模式

VR游戏《守护者:星陨》将于明年发布抢先体验版,看起来像VR版《地狱潜者 2》

理想汽车OTA 8.1开启推送:支持绑定理想AI眼镜

Meta MR眼镜发布时间推迟至2027年,26年将发布一款新的可穿戴设备