编译 / VRAR星球 R星人
Meta日前推出了一款AI声音生成模型Audiobox,能够同时接收语音及文字输入,用户可同时使用语音及文字描述,让这款模型生成所需的音频。据悉,这款模型基于Meta今年6月推出的Voicebox AI模型,据称Audiobox能生成各种环境音、自然对话语音,并整合了音频生成和编辑能力,以便于用户自由生成自己所需的音频。
图源:ai.meta
Meta介绍称,生成高品质音频需要有大量音频库及深厚的领域知识,但大众难以获得这些资源,而该公司推出这个模型旨在降低声音生成门槛,让任何人都更容易制作视频、游戏等应用场景的音效。
这款Audiobox模型基于Voicebox的“引导声音”机制,以便于生成目标音频,并配合“流量比对(flow-matching)”扩散模型生成方法,以实现“声音填充(audio infilling)”功能,从而生成多层次的音频。
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。
Meta新发明靠肌肉信号控制设备,戴个手环就能隔空操控电脑
Brilliant Labs将于7月31日发布新款AI眼镜
阿里眼镜AR/AI更多信息泄露,主板电池后置,采用衍射光波导
阿里首款自研AI眼镜正式发布,含带显示和不带显示两款,支持高德导航、支付宝看一下支付等功能
消息称OpenAI准备在8月初发布新一代GPT-5模型
《动物公司》成为收入第五高的Quest游戏,每日活跃用户数最高达到50万
经典科普IP《十万个为什么》拥抱XR技术,首个成果将于年内全球首发
南宁市青秀山风景区启动“XR时空任意门”
广州:发展VR/AR体育赛事,打造沉浸式观赛场景,宣传冠军元宇宙讲堂