编译 / VRAR星球 R星人
7 月 10 日,谷歌在 Gemini 应用中上线了基于 Veo 3 模型的图像转视频功能,用户可以将照片变成带有背景音效、环境声、语音的 8 秒钟短视频。
谷歌表示,这项视频功能现已在部分地区向 AI Ultra 和 AI Pro 用户开放,今起先在网页版推出,移动端将在本周逐步上线。
据了解,该功能使用时,Gemini 用户只需点击提示栏的“工具”,选择“视频”,上传照片并添加提示词,描述希望照片如何动起来。用户还可以加入对白、音效或环境声等音频描述,谷歌表示音频和画面会实现“完美同步”。最终视频为 720p、16:9 横屏的 MP4 格式。
谷歌表示,用户可以为日常物品赋予动画效果,让绘画作品“活”起来,或为自然景象添加动态,尽情发挥创意,所有生成视频均带有明显的 AI 水印和隐形的 SynthID 数字水印。(新闻来源:IT之家)
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。
南京博物院VR大空间沉浸式展览”正式面向公众开放
三星移动体验业务部负责人:Project Moohan头显今年推出,正在开发智能眼镜
全球首次!主持人戴Rokid Glasses实时播报台风信息
OpenAI计划在“未来几周”推出一款人工智能网络浏览器
谷歌Gemini接入Veo 3 AI模型:可将照片变成带有背景音效、环境声、语音的8秒视频
Quest系统UI大修完成关键改进,替换难看的半透明灰色背景
Snapchat和RWS Global携手打造全球体育赛事AR体验
育碧对其Red Storm工作室进行裁员,涉及多个VR项目开发
瑞士光场显示技术公司CREAL完成890万美元融资,蔡司领投
南京博物院VR大空间沉浸式展览”正式面向公众开放
三星移动体验业务部负责人:Project Moohan头显今年推出,正在开发智能眼镜
全球首次!主持人戴Rokid Glasses实时播报台风信息
OpenAI计划在“未来几周”推出一款人工智能网络浏览器
谷歌Gemini接入Veo 3 AI模型:可将照片变成带有背景音效、环境声、语音的8秒视频
Quest系统UI大修完成关键改进,替换难看的半透明灰色背景
Snapchat和RWS Global携手打造全球体育赛事AR体验
育碧对其Red Storm工作室进行裁员,涉及多个VR项目开发
瑞士光场显示技术公司CREAL完成890万美元融资,蔡司领投