谷歌Gemini 2.5 Flash升级AI修图功能，多项表现优于GPT-4o

发布日期：2025-08-27 14:46:36

字号：A+A-

编译 / VRAR星球 R星人

8 月 26 日，科技媒体 The Decoder 昨日（8 月 26 日）发布博文，报道称谷歌 DeepMind 推出全新 Gemini 2.5 Flash 图像编辑模型，在 Gemini 应用中可根据文字指令，在保持人物与动物的外观一致的情况下，提高修改图片的精度。

与此前的原生图像生成工具相比，它在根据文字进行图像修改时的准确率更高，甚至在多项任务中优于 ChatGPT 所用的 GPT-4o，让其能更好地基于复杂文字编辑图像。

据悉，新模型的亮点是“角色一致性”功能。在生成多张图像后，即便人物姿势、背景或光线发生变化，也能保持同一人、动物或物体的外观一致。这对于创建系列照片、产品多角度展示尤其有价值，适合品牌素材与产品目录的批量制作。

目前，开发者可通过 Gemini API、Google AI Studio 与 Vertex AI 试用，费用为每百万输出 token 30 美元，单张图像成本约 0.039 美元。（新闻来源：IT之家）

商务合作：13146398132 undefined

媒体合作：13341147250

爆料投稿：editor@vrarworld.cn

如需转载请联系13341147250 / editor@vrarworld.cn 申请授权，转载时请注明来源并保留VRAR星球原文链接。

本文部分图片及视频来源于互联网，如涉及侵权请联系我们删除。

已赞 7

谷歌 Gemini 2.5 Flash AI修图 GPT-4o

相关推荐

谷歌重启AI眼镜：富士康代工，三星设计，或2026Q4发布

谷歌放弃VR创意工具Blocks项目，并将其开源

谷歌确认三星XR头显设备将在安卓系统运行

GPT-4o加持，颜值、功能全拉满！这款AI智能眼镜要让Ray-Ban Meta坐不住了

谷歌的AR地图专利或将解锁低功耗智能眼镜

谷歌与国内消费级AR眼镜厂商XREAL达成战略合作

内部混乱、摇摆不定的谷歌，这次可能又打算要重启AR梦

谷歌新增图片翻译功能，使用AR翻译技术

雨果·巴拉等前Meta、谷歌XR负责人成立的AI初创公司AIOS获5600万美元融资

谷歌将从下周开始完全闭门开发安卓操作系统，并不意味着闭源

发表评论（0）

热门资讯