4 月 23 日,Character.AI 公司在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。用户只需上传一张图片并挑选一个声音,平台即可生成会说话、会移动的形象。这些形象还能展现情感,呈现出令人惊叹的真实感和流畅度。
公司表示,这得益于一种名为“SOTA DiT-based diffusion video generation model”的先进 AI 模型。该模型经过精心训练,结合音频条件优化技术,能高效生成高质量视频。
AvatarFX 的技术亮点在于其“高保真、时间一致性”的视频生成能力。即便面对多角色、长序列或多轮对话的复杂场景,它也能保持惊人的速度和稳定性。与 OpenAI 的 Sora 和 Google 的 Veo 等竞争对手相比,AvatarFX 并非从零开始或基于文本生成视频,而是专注于将特定图片动画化。
这种独特的工作流程为用户提供了新颖体验,但也带来了潜在风险。用户可能上传名人或熟人照片,制作看似真实的虚假视频,引发隐私和伦理争议。(新闻来源:IT之家)
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。
苹果将为Vision Pro原生支持Godot免费开源游戏引擎
The Sandbox与Bruce Lee Enterprises合作,李小龙“入驻”元宇宙
歌尔股份发布2025年Q1财报:净利润4.69亿元,同比增长23.53%
Vision Pro新专利:佩戴者眼球一动,实现解锁、切换设置等
苹果将为Vision Pro原生支持Godot免费开源游戏引擎
Ray-Ban智能眼镜实用性大增,Meta推出实时翻译功能
Meta开卖翻新版Quest 3S,售价270美元起
The Sandbox与Bruce Lee Enterprises合作,李小龙“入驻”元宇宙
歌尔股份发布2025年Q1财报:净利润4.69亿元,同比增长23.53%
Vision Pro新专利:佩戴者眼球一动,实现解锁、切换设置等
北京国际电影节举办AI+VR项目创投会,VRAR星球参展
PICO视频新预告:3D穿越机带你飞掠绿野山居、地下迷窟、VR宇宙之旅第二季-宇宙射线
Character.AI推出AvatarFX模型:AI实现静转动,让图片角色开口说话
苹果将为Vision Pro原生支持Godot免费开源游戏引擎
Ray-Ban智能眼镜实用性大增,Meta推出实时翻译功能
Meta开卖翻新版Quest 3S,售价270美元起
The Sandbox与Bruce Lee Enterprises合作,李小龙“入驻”元宇宙
歌尔股份发布2025年Q1财报:净利润4.69亿元,同比增长23.53%
Vision Pro新专利:佩戴者眼球一动,实现解锁、切换设置等
北京国际电影节举办AI+VR项目创投会,VRAR星球参展
PICO视频新预告:3D穿越机带你飞掠绿野山居、地下迷窟、VR宇宙之旅第二季-宇宙射线
Character.AI推出AvatarFX模型:AI实现静转动,让图片角色开口说话