4 月 9 日消息,亚马逊发布了名为 Nova Sonic 的新一代生成式 AI 模型,该模型能够原生处理语音并生成自然流畅的语音。据亚马逊声称,Nova Sonic 在速度、语音识别以及对话质量等关键指标的基准测试中,表现可与 OpenAI 和谷歌的前沿语音模型相媲美。
Nova Sonic 的问世是亚马逊对新兴 AI 语音模型的有力回应,例如为 ChatGPT 语音模式提供支持的模型,相较于亚马逊早期的 Alexa 等较为刻板的模型,这些新模型在语音交互时更加自然。
Nova Sonic 通过亚马逊的 Bedrock 开发者平台提供给用户,该平台是用于构建企业级 AI 应用的工具,Nova Sonic 则通过一个全新的双向流式 API 进行接入。在一份新闻稿中,亚马逊称 Nova Sonic 是市场上“最具成本效益”的 AI 语音模型,其价格比 OpenAI 的 GPT-4o 便宜约 80%。
据亚马逊高级副总裁兼人工通用智能(AGI)部门首席科学家罗希特・普拉萨德介绍,Nova Sonic 的部分组件已经为亚马逊升级版数字语音助手 Alexa+ 提供了动力支持。
普拉萨德表示,与竞争对手的 AI 语音模型相比,Nova Sonic 在将用户请求路由到不同 API 方面表现出色。这一能力使得 Nova Sonic 能够知晓何时需要从互联网获取实时信息、解析专有数据源,或者在外部应用程序中采取行动,并使用合适的工具来完成任务。
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。