谷歌Gemini接入Veo 3 AI模型：可将照片变成带有背景音效、环境声、语音的8秒视频

发布日期：2025-07-11 17:20:37

字号：A+A-

编译 / VRAR星球 R星人

7 月 10 日，谷歌在 Gemini 应用中上线了基于 Veo 3 模型的图像转视频功能，用户可以将照片变成带有背景音效、环境声、语音的 8 秒钟短视频。

谷歌表示，这项视频功能现已在部分地区向 AI Ultra 和 AI Pro 用户开放，今起先在网页版推出，移动端将在本周逐步上线。

据了解，该功能使用时，Gemini 用户只需点击提示栏的“工具”，选择“视频”，上传照片并添加提示词，描述希望照片如何动起来。用户还可以加入对白、音效或环境声等音频描述，谷歌表示音频和画面会实现“完美同步”。最终视频为 720p、16:9 横屏的 MP4 格式。

谷歌表示，用户可以为日常物品赋予动画效果，让绘画作品“活”起来，或为自然景象添加动态，尽情发挥创意，所有生成视频均带有明显的 AI 水印和隐形的 SynthID 数字水印。（新闻来源：IT之家）

商务合作：13146398132 undefined

媒体合作：13341147250

爆料投稿：editor@vrarworld.cn

如需转载请联系13341147250 / editor@vrarworld.cn 申请授权，转载时请注明来源并保留VRAR星球原文链接。

本文部分图片及视频来源于互联网，如涉及侵权请联系我们删除。

已赞 8

谷歌 Gemini Veo 3 AI

相关推荐

苹果高管自认为其内部AI聊天机器人不弱于OpenAI的ChatGPT

雨果·巴拉等前Meta、谷歌XR负责人成立的AI初创公司AIOS获5600万美元融资

谷歌发布新一代推理模型Gemini2.5：单次可处理百万token

彭博社：苹果AI服务Apple Intelligence将登录Vision Pro

内部混乱、摇摆不定的谷歌，这次可能又打算要重启AR梦

谷歌为Play Store添加了“安卓XR”全新设备标识

Character.AI推出AvatarFX模型：AI实现静转动，让图片角色开口说话

马斯克：“地球上最聪明的AI” Grok 3大模型即将发布

谷歌发明基于雷达的解决方案 “Soli”，可对XR设备的谷歌操作系统进行手势识别控制

谷东科技携AR+AI技术亮相全国云计算大数据行业产教融合共同体工作会

发表评论（0）

热门资讯