编译 / VRAR星球 R星人
Meta日前推出了一款AI声音生成模型Audiobox,能够同时接收语音及文字输入,用户可同时使用语音及文字描述,让这款模型生成所需的音频。据悉,这款模型基于Meta今年6月推出的Voicebox AI模型,据称Audiobox能生成各种环境音、自然对话语音,并整合了音频生成和编辑能力,以便于用户自由生成自己所需的音频。

图源:ai.meta
Meta介绍称,生成高品质音频需要有大量音频库及深厚的领域知识,但大众难以获得这些资源,而该公司推出这个模型旨在降低声音生成门槛,让任何人都更容易制作视频、游戏等应用场景的音效。
这款Audiobox模型基于Voicebox的“引导声音”机制,以便于生成目标音频,并配合“流量比对(flow-matching)”扩散模型生成方法,以实现“声音填充(audio infilling)”功能,从而生成多层次的音频。
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

舜宇光学19亿“联姻”歌尔光学,加速AI/AR光学赛道整合

谷歌发布会透露:三款智能眼镜待发布,2027年将发布双目显示版

为Gemini AI装上“眼睛”:谷歌与XREAL联合发布Project Aura

特斯拉Optimus机器人演示时摔倒手忙脚乱“摘VR头显”,暴露并非完全AI驱动

《黑袍纠察队》官方VR衍生游戏《触发警告》宣传片公开

AStation将于12月16日举办第二届技术分享会

科技赋能文旅融合:影核签约云南,共建XR大空间数字体验新阵地

昀光科技完成A轮融资 正式启动12英寸硅基OLED产线建设

Meta收购超2.3亿元融资AI硬件公司

为Gemini AI装上“眼睛”:谷歌与XREAL联合发布Project Aura

全黑色苹果Vision头显部件曝光,或为Vision Air设计

扎克伯格官宣!苹果前VP执掌Meta AI硬件新部门

Meta收购超2.3亿元融资AI硬件公司

全球首款8K全景无人机,影石影翎A1开售首日国内销售额超2000万

《恐惧子午线》在1月发售前公布多人游戏模式

VR游戏《守护者:星陨》将于明年发布抢先体验版,看起来像VR版《地狱潜者 2》

理想汽车OTA 8.1开启推送:支持绑定理想AI眼镜

Meta MR眼镜发布时间推迟至2027年,26年将发布一款新的可穿戴设备