9 月 18 日消息,近日,快手旗下的可灵 AI 推出全新数字人功能,通过一张角色图片加一段文字或音频,即可生成 1080p / 48FPS、最长 1 分钟的数字人视频。目前产品公测陆续开放中。
该数字人功能基于多模态理解与视频生成模型的深度结合,实现了口型精准同步以及情绪动作的精细控制。其采用的基于 Transformer 的 DiT 架构,在处理时序信息和细粒度控制方面具有独特优势,能够精准解析面部特征、理解音频语义,并根据语音内容推断合适的面部表情和微动作,从而确保生成的数字人在视频全程保持角色一致性。

在角色和语言支持方面,可灵 AI 数字人功能表现出色。其支持多种角色类型,包括真人、动画角色甚至动物形象,同时涵盖中、英、日、韩等多语种,能够满足不同用户的多样化需求。在价格策略上,结合会员优惠,可灵 AI 数字人的使用成本最低为 0.12 元 / 秒。
目前,可灵 AI 数字人功能正处于公测阶段,产品已陆续向用户开放使用。用户可以通过可灵 AI 官网进行体验。未来,随着技术的不断成熟和 API 的开放,可灵 AI 数字人有望与更多第三方平台和应用集成,构建起更加完善的生态系统。(新闻来源:IT之家)
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

ROKID新品发布,风语筑同步推出AI智能导览系统,重构文博交互体验

百度正式发布小度AI眼镜Pro:支持AI识物、AI翻译,售价2299元

Rokid与BOLON发布AI智能眼镜,林一与影视飓风Tim一同助阵

Valve表示目前没有新的第一方VR游戏正在开发中

百度地图 x 莫界亮相百度世界大会 解锁 AI+AR 出行新体验

魅族 StarV 眼动方案探索版概念机(Concept ET)亮相,开启交互型消费新纪元

创新引领 元启未来丨雄安兴元亮相2025数博会

央视《新闻直播间》:亮亮视野AR翻译眼镜通过产业链协同创新破解跨国沟通难题

沉浸式AR互动体验成为COP30中国角活动亮点