4月15日,bleepingcomputer发文报道称 OpenAI 最新发布的 GPT-4.1 系列模型,其性能相比 GPT-4o 虽然实现重大飞跃,但多项跑分未能超越谷歌的 Gemini 系列。

据了解,OpenAI 公司日前发布 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,官方公布的跑分数据来看,这些模型在编程方面的能力,远超 GPT-4o 及 GPT-4o mini。例如在 SWE-bench Verified 跑分中,GPT-4o 的得分为 21.4%,GPT-4.5 的得分为 26.6%,而 GPT-4.1 的得分为 54.6%。
尽管性能有较大提升,不过根据多位专家测试,相比较谷歌的 Gemini 系列,GPT-4.1 对比中却显露劣势。
根据 Stagehand(一款生产级浏览器自动化框架)发布的基准数据,Gemini 2.0 Flash 的错误率仅为 6.67%,精确匹配率高达 90%,且价格低廉、速度更快。相比之下,GPT-4.1 的错误率高达 16.67%,成本更是 Gemini 2.0 Flash 的 10 倍以上。
此外,哈佛大学 RNA 科学家 Pierre Bongrand 提供的数据也指出,GPT-4.1 的性价比不及 Gemini 2.0 Flash、Gemini 2.5 Pro 及 DeepSeek 等竞品。
在编码专项测试中,GPT-4.1 同样未能占据上风。Aider Polyglot 的测试结果显示,GPT-4.1 的编码得分仅为 52%,而 Gemini 2.5 则以 73% 的成绩遥遥领先。
值得注意的是,GPT-4.1 被归类为非推理模型(non-reasoning model),但其编码能力仍属行业顶尖。(新闻来源:IT之家、bleepingcomputer)
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

舜宇光学19亿“联姻”歌尔光学,加速AI/AR光学赛道整合

谷歌发布会透露:三款智能眼镜待发布,2027年将发布双目显示版

为Gemini AI装上“眼睛”:谷歌与XREAL联合发布Project Aura

特斯拉Optimus机器人演示时摔倒手忙脚乱“摘VR头显”,暴露并非完全AI驱动

《黑袍纠察队》官方VR衍生游戏《触发警告》宣传片公开

AStation将于12月16日举办第二届技术分享会

科技赋能文旅融合:影核签约云南,共建XR大空间数字体验新阵地

昀光科技完成A轮融资 正式启动12英寸硅基OLED产线建设

Meta收购超2.3亿元融资AI硬件公司

为Gemini AI装上“眼睛”:谷歌与XREAL联合发布Project Aura

全黑色苹果Vision头显部件曝光,或为Vision Air设计

扎克伯格官宣!苹果前VP执掌Meta AI硬件新部门

Meta收购超2.3亿元融资AI硬件公司

全球首款8K全景无人机,影石影翎A1开售首日国内销售额超2000万

《恐惧子午线》在1月发售前公布多人游戏模式

VR游戏《守护者:星陨》将于明年发布抢先体验版,看起来像VR版《地狱潜者 2》

理想汽车OTA 8.1开启推送:支持绑定理想AI眼镜

Meta MR眼镜发布时间推迟至2027年,26年将发布一款新的可穿戴设备