首页
资讯
深度
投融资
政策
活动
视频
当前模式 菜单关闭
我们能帮忙找点什么吗?

谷歌Gemini 2.5 Flash升级AI修图功能,多项表现优于GPT-4o

发布日期:2025-08-27 14:46:36
字号:A+A-

编译 / VRAR星球 R星人


8 月 26 日,科技媒体 The Decoder 昨日(8 月 26 日)发布博文,报道称谷歌 DeepMind 推出全新 Gemini 2.5 Flash 图像编辑模型,在 Gemini 应用中可根据文字指令,在保持人物与动物的外观一致的情况下,提高修改图片的精度。

 

与此前的原生图像生成工具相比,它在根据文字进行图像修改时的准确率更高,甚至在多项任务中优于 ChatGPT 所用的 GPT-4o,让其能更好地基于复杂文字编辑图像。

 

据悉,新模型的亮点是“角色一致性”功能。在生成多张图像后,即便人物姿势、背景或光线发生变化,也能保持同一人、动物或物体的外观一致。这对于创建系列照片、产品多角度展示尤其有价值,适合品牌素材与产品目录的批量制作。

 

 

值得注意的是,Gemini 2.5 Flash 还支持精准的局部文字编辑,用户无需手动圈选即可完成背景虚化、去除瑕疵、添加颜色或移除物体等操作。该模型能一次融合最多三张图像,例如将产品照与室内照片结合成逼真的场景。它还支持“风格迁移”,将一种纹理、颜色或图案应用到另一物体上,同时保持形状与细节完整。基于“现实推理”的功能更可模拟简单因果,如生成气球飞向仙人掌及随后的结果画面。

 

目前,开发者可通过 Gemini API、Google AI Studio 与 Vertex AI 试用,费用为每百万输出 token 30 美元,单张图像成本约 0.039 美元。(新闻来源:IT之家)


商务合作:13146398132undefined

媒体合作:13341147250

爆料投稿:editor@vrarworld.cn

版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。

如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。

本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

发表评论(0
热门资讯