编译 / VRAR星球 R星人
新加坡南洋理工大学的研究团队近日公开了一项名为SOLAMI的AI技术,它能创造出活灵活现的3D虚拟角色,不仅能在VR世界里跟你实时互动,还能理解你的语音和动作,陪你聊天、跳舞甚至打拳击。
该系统利用先进的社交视觉-语言-行为模型,结合合成的数据集,提供更自然的交流体验,超越了传统的文本和语音交互。
图源:solami-ai.github.io
据了解,SOLAMI是一个端到端的社会视觉-语言-动作(VLA)建模框架,它利用深度学习技术,将用户的语音和动作转换为虚拟角色可以理解的“语言”,并生成相应的语音和动作回应。这意味着它能把你的语音和动作翻译成AI听得懂的语言,然后让虚拟角色做出相应的反应,就像真人一样自然流畅,告别以往AI角色的呆板和机械感。
研究人员创建了一个名为SynMSI的合成数据集,里面包含了海量的对话、动作和语音数据。这些数据利用现有的动作数据库和强大的语言模型,经过精心设计和处理生成。此外,SOLAMI还搭载了一个VR界面,用户戴上VR设备后,就能看到虚拟角色站在面前,与用户聊天、互动,仿佛置身于真实的社交场景中。
研究团队表示,SOLAMI技术应用前景非常广阔,未来可能颠覆游戏、虚拟社交和教育培训等多个领域。
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。
PICO开始支持个人开发者自助上架+分发付费应用
谷歌将在I/O大会低调举办Android XR讲座
Reality Labs受到重创,Meta裁员上百人
OpenAI推出轻量级ChatGPT深度研究工具,免费用户也能用
Adobe挑战OpenAI,安卓/iOS版AI生图工具Firefly蓄势待发
Horizon Worlds现已支持音乐会等活动的3D 180°视频
影核VR新作《海上传奇:女王的崛起》登陆PICO平台
腾讯混元3D模型全新升级
Sightful推出推出适用于Windows的AR办公套装Spacetop,售价899美元
苹果将为Vision Pro原生支持Godot免费开源游戏引擎
Ray-Ban智能眼镜实用性大增,Meta推出实时翻译功能
Meta开卖翻新版Quest 3S,售价270美元起
The Sandbox与Bruce Lee Enterprises合作,李小龙“入驻”元宇宙
歌尔股份发布2025年Q1财报:净利润4.69亿元,同比增长23.53%
Vision Pro新专利:佩戴者眼球一动,实现解锁、切换设置等
北京国际电影节举办AI+VR项目创投会,VRAR星球参展
PICO视频新预告:3D穿越机带你飞掠绿野山居、地下迷窟、VR宇宙之旅第二季-宇宙射线
Character.AI推出AvatarFX模型:AI实现静转动,让图片角色开口说话