Meta推出AI音频模型Audiobox：支持语音及文字同时输入 - VRAR星球

首页

资讯: 国内资讯; 国际资讯; 新闻日历; VR/AR游戏; 协会

深度: 产业锐评; 热点追踪; 维克多专栏; 万花筒; 人物专访; 百科; 测评

投融资: 融资月刊; 投融资新闻; 上市公司

政策: 政策新闻; 政策查询; 政策汇总

活动: 协会活动; 行业活动; 合作活动; 星球活动

视频: 评测; 专访; 现场

投融资: 融资月刊; 投融资新闻; 上市公司

政策: 政策新闻; 政策查询; 政策汇总

活动: 协会活动; 行业活动; 合作活动; 星球活动

视频: 评测; 专访; 现场

当前位置：首页资讯新闻日历

Meta推出AI音频模型Audiobox：支持语音及文字同时输入

发布日期：2023-12-05 13:00:00

字号：A+A-

编译 / VRAR星球 R星人

Meta日前推出了一款AI声音生成模型Audiobox，能够同时接收语音及文字输入，用户可同时使用语音及文字描述，让这款模型生成所需的音频。据悉，这款模型基于Meta今年6月推出的Voicebox AI模型，据称Audiobox能生成各种环境音、自然对话语音，并整合了音频生成和编辑能力，以便于用户自由生成自己所需的音频。

图源：ai.meta

Meta介绍称，生成高品质音频需要有大量音频库及深厚的领域知识，但大众难以获得这些资源，而该公司推出这个模型旨在降低声音生成门槛，让任何人都更容易制作视频、游戏等应用场景的音效。

这款Audiobox模型基于Voicebox的“引导声音”机制，以便于生成目标音频，并配合“流量比对（flow-matching）”扩散模型生成方法，以实现“声音填充（audio infilling）”功能，从而生成多层次的音频。

商务合作：13146398132 undefined

媒体合作：13341147250

爆料投稿：editor@vrarworld.cn

版权声明：本文为VRAR星球原创，任何单位及个人未经授权不得转载，否则将依法追究侵权责任。

如需转载请联系13341147250 / editor@vrarworld.cn 申请授权，转载时请注明来源并保留VRAR星球原文链接。

本文部分图片及视频来源于互联网，如涉及侵权请联系我们删除。

已赞 3

Meta AI音频模型 Audiobox 同时输入

相关推荐

Meta正式停止支持初代Quest VR头显，不再提供安全更新和修复

Meta CTO表示，Meta的新款EMG腕带不会取代Quest控制器

Meta将在洛杉矶开设智能眼镜线下旗舰店

新证据表明Meta仍在为Quest开发PC VR云游戏流媒体

Meta完成对语音AI初创企业PlayAI收购，全公司本周加入Meta

Meta全新高端智能眼镜售价或超1000美元；国产AI眼镜有望在Q2迎来大规模发布；西安成立全国首支XR发展基金

Meta移除用于查看Quest全球成就排名的应用程序，引起开发者和用户不满

Meta官方：Quest 3拥有Quest系列的最高分辨率

KIWI Design加入Meta “Made for Meta”生产计

Meta面临诉讼，指控Ray-Ban智能眼镜向海外评测人员发送私人视频

发表评论（0）

热门资讯

今日七日本月

联系方式: 邮箱：info@vrarworld.cn
座机：010-58672009
客服：13146398132
地址：北京市朝阳区东三环南路58号富顿中心A座1215

关于我们

媒体矩阵

关注微信公众号
扫码添加客服

Copyright © VRAR星球版权所有京ICP备2021003882号-3 Design by 企术：网站建设