文 / VRAR星球 Vivi
只需一张角色照片,加上一段配音或文字,你就能立刻生成一段高清流畅(1080p/48帧)、最长1分钟的数字人视频——没错,快手旗下的“可灵AI”刚刚推出了全新的数字人视频生成功能,目前已经陆续开放公测。
这也意味着,又一家互联网巨头正式杀入了AI数字人赛道。
现在布局数字人的可不止快手,百度、京东、抖音、华为等大厂也早已纷纷入场,推出了能带货、会互动、甚至24小时不休息的虚拟主播。你会发现,数字人正迅速“占领”电商直播间、短视频内容,甚至悄悄变成了你手机那头的智能客服。
那么,问题来了:数字人真正的价值到底在哪儿?它会不会成为AI技术爆发的下一个入口?是让我们和机器的交流更像“跟人对话”?还是说,它正在悄悄模糊虚拟与现实的边界,成为未来融合的关键一步?
AI数字人突然成了科技圈的“顶流”,百度、快手、京东、抖音……几乎所有大厂都在布局。这背后,可不只是赶时髦。
来看几个爆火的例子,你就懂了。
先说说那个轰动全网的“罗永浩数字人”。今年6月15日,罗永浩的数字人亮相百度优选的直播间,和助理朱萧木的数字形象共同直播带货。据百度电商官方数据,这场直播持续了7个小时,观看人次超过130万人,GMV突破5500万,其中,1/3的产品销量超过罗永浩5月底的直播场次。
罗永浩数字人直播,图源:网络
而且,这个数字人可不是普通那种机械念稿的“假人”。它会冷不丁插话打断同伴、主动抽奖发福利,还时不时喊观众刷一波“666”,完全复刻了老罗本尊的幽默感和接梗能力。背后全靠大模型支撑:整场直播AI调用知识库1.3万次,自动生成了9.7万字的产品讲解。这输出能力,估计真人主播也望尘莫及。
再说一个破圈的——AI歌手Yuri。
今年6月,这位挑染蓝发、手攥骷髅话筒的“虚拟女孩”突然爆红。她不是真人,而是汗青工作室旗下AI.Talk节目打造的首位AI歌手,她的首支从作曲、编曲、演唱到画面均由AI独立完成的单曲《SURREAL》上线即火,播放量破700万,还登上了日本、北美等地的热榜。
Yuri 甚至站上了外滩大会这样的大型场合,从容地进行演讲。台风稳、表达溜,彻底打破了“虚拟人没人味儿”的刻板印象。
可以看出,2025年,AI数字人正呈现三大突破:一是交互能力大幅升级,不仅能对答如流,还会抛梗互动;二是成本极大降低,京东数字人直播成本只有真人1/10,日均不到100元;三是适用场景越来越广,从电商带货到短剧、音乐、演讲,全面开花。
现在的数字人,早就不再是“人形PPT”了。在大模型加持下,它们能创作、懂用户、有情感,甚至比真人更高效。
一句话:AI数字人不再只是“科技噱头”,它正在切切实实改变直播、内容创作甚至人际交互的方式。谁先抢占高地,谁就可能吃透下一波AI红利。
据IDC预测,到2026年,中国AI数字人市场规模将突破百亿,达到102.4亿元。艾媒咨询也显示,2025年中国数字人带动的核心市场和相关产业规模,预计将分别达到480.6亿元和6402.7亿元——都是2023年的两倍。可以说,数字人已然成为AI领域最炙手可热的黄金赛道之一。
面对这样一个高速增长、钱景巨大的市场,几乎所有互联网巨头都已“重兵布局”,打法各异、各显神通:
百度:打造高说服力数字人
百度在数字人领域布局早、投入深。百度创始人李彦宏也曾亲自体验过百度数字人相关技术,并对业务线表达了信心,他在今年4月百度Create大会上表示:“2025年最令人激动的突破性应用之一,就是AI数字人”。
信心不止在口号,也反映在实际业绩中,百度创始人李彦宏在Q2财报电话会上披露,Q2数字人产生的收入环比增长55%,据电话会披露信息计算,约为5亿元。
与此同时,百度还推出了“梦蝶计划”和“繁星计划”。梦蝶计划将通过超头主播数字人打造、流量和预算扶持,实现百度优选超头主播的数量倍增。
繁星计划则将再次追加10万个慧播星免费数字人,投入1亿元数字人消费补贴,增加千万级别的运营扶持,帮助更多的普通人、中小企业开启数字人直播。
京东:低成本高效带货,真人主播的“超强替补”
电商巨头京东同样全力加码虚拟数字人。据了解,京东在2024年春节试水数字人直播,其言犀数字人春节期间累计带货GMV超4000万元。
今年“618”期间,京东数字人直播已经实现“高商业可用”。数字人直播成本仅为真人1/10,可以7×24小时全天开播,提升直播间转化率30%,直播表现超过80%真人主播。
在 618 期间,京东还推出了六大行业定制数字人,包括赛博先锋、国风达人、运动少女、成熟型男、青春男大、职场丽人等,针对不同品类商家匹配数字人设计,免费开放给京东商家使用。
字节:让数字人拥有“灵魂”
字节跳动数字人团队则是推出了备受瞩目的OmniHuman-1.5,作为其前身OmniHuman-1的升级版本,这一全新多模态数字人方案在AI视频生成领域再次掀起热潮。
OmniHuman-1.5通过结合单张图像和音频输入,生成高度逼真的动态视频,不仅提升了动作协调性和表现力,还新增多项突破性功能,可广泛应用于影视、虚拟主播、教育、广告等领域,让数字人越来越有“人味儿”。
字节跳动OmniHuman-1.5生成demo,图源:网络
华为:一站式数字人“云工厂”
依托盘古大模型、媒体音视频、协同办公等技术,华为云MetaStudio提供数字人形象训练、声音克隆、视频制作、直播、智能交互等云服务。开发者通过集成API/SDK并结合自身场景,可快速构建端到端行业解决方案。仅需单张照片或3-5分钟真人音视频,MetaStudio就能生成高拟真数字人,形象与声音无限接近真人。
此外,华为云数字人还在金融、医疗、文旅等行业都已实现多场景应用。
除此之外,腾讯、商汤科技、追一科技等AI企业也在这一赛道积极布局,推动数字人向更多应用场景渗透。可以说,谁掌握了数字人,谁就可能握紧AI时代的又一张门票。
从电商直播到短剧创作,从虚拟偶像到行业服务,数字人正在多个维度同步推开应用的大门。它既是AI技术规模化落地的典型场景,也是人类面对虚拟与现实融合的一次深度探索。
没有人能完全断言终点何在,但可以确定:这场刚刚开始的数字人浪潮,终将重新定义人机关系、内容形态与每一个普通人的数字化生存方式。
(文中未标注来源的图片均来源于网络)
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。