文 / VRAR星球 R星人
3月23日,英伟达在其开发者博客发布了一篇新的文章,称他们正在测试一个新的工具包——Test Project Mellon,以探索创建由自然语言语音命令控制的免提扩展现实(XR)体验。
据了解,Project Mellon是一个轻量级的Python包,能够利用语音AI ( NVIDIA Riva )和大型语言模型(LLM)(NVIDIA NeMo 服务)的重量级功能来简化沉浸式环境中的用户交互。
英伟达认为,言语可以做很多事情,此项目的目的,就是以实用的方式利用语音AI和LLM的力量打开虚拟世界的大门,做更多的事情。通过Project Mellon,几乎任何应用程序的开发人员都可以轻松地将自然语言理解添加到他们的软件中。这不仅降低了协作XR技术的入门门槛,同时也能够使IC.IDO Weave中的用户体验更加人性化。
具体而言,Project Mellon 1.0的主要发布功能包括:轻量级、易于集成的Python库;LLM支持自然语言理解的准确性零样本语言模型,无需特定命令训练;具有会话和视觉上下文的自然语言命令支持;支持询问有关命令和场景的问题,具有自然语言响应;用于命令理解和执行的简单Python API;基于Web的测试应用程序;以及ASR、TTS、LLM 和神经机器翻译(NMT)可以在本地或远程托管,具有较短的响应时间。

图源:nvidia
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

三星Galaxy XR可选追踪手柄已售罄,新用户或将等待三周以上

阿里巴巴将于24日零点开启夸克AI眼镜预售,平台补贴后最低3699元

亚马逊发布“Amelia”智能眼镜,内置显示屏和始终开启的摄像头

理湃光晶完成新一轮融资,几何光波导全面引领AR产业爆发

用科技延伸仁心:创新工具守护生命健康

2025 AIRS香港科技峰会圆满落幕,勾勒“AI与机器人+”时代新图景

《铸魂·台湾光复》VR互动电影于台湾光复80周年“第十二届大江论坛”首展

M5 Apple Vision Pro现已上市,但M2型号无法以旧换新

王自如对话李宏伟:AR眼镜的“iPhone时刻”或在2027年

三星Galaxy XR可选追踪手柄已售罄,新用户或将等待三周以上

阿里巴巴将于24日零点开启夸克AI眼镜预售,平台补贴后最低3699元

亚马逊发布“Amelia”智能眼镜,内置显示屏和始终开启的摄像头

理湃光晶完成新一轮融资,几何光波导全面引领AR产业爆发

用科技延伸仁心:创新工具守护生命健康

2025 AIRS香港科技峰会圆满落幕,勾勒“AI与机器人+”时代新图景

《铸魂·台湾光复》VR互动电影于台湾光复80周年“第十二届大江论坛”首展

M5 Apple Vision Pro现已上市,但M2型号无法以旧换新

王自如对话李宏伟:AR眼镜的“iPhone时刻”或在2027年