2月25日晚,阿里巴巴宣布全面开源旗下视频生成模型万相2.1模型。据介绍,此次开源基于Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace和魔搭社区下载体验。

通义万相是阿里云通义系列AI绘画创作大模型,可辅助人类进行图片创作,于2023年7月7日正式上线。在2024年9月19日的阿里云栖大会上,阿里发布了通义万相视频生成大模型。
在视频生成方面,通义万相 2.1 通过自研的高效 VAE 和 DiT 架构增强了时空上下文建模能力,支持无限长 1080P 视频的高效编解码,首次实现了中文文字视频生成功能,登上 VBench 榜单第一。
据介绍,通义万相 2.1 支持中英文视频,都可以一键生成艺术字,还提供多种视频特效选项,以增强视觉表现力,例如过渡、粒子效果、模拟等等。其还支持复杂运镜,可还原碰撞、反弹、切割、挤压等真实世界的物理规律,例如雨滴落在伞上会溅起水花。
官方曾表示,通义万相 2.1 支持中英文一键生成艺术字,还提供了多种视频特效选项,如过渡、粒子效果、模拟等等。(新闻来源:IT之家)
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

三星Galaxy XR可选追踪手柄已售罄,新用户或将等待三周以上

阿里巴巴将于24日零点开启夸克AI眼镜预售,平台补贴后最低3699元

亚马逊发布“Amelia”智能眼镜,内置显示屏和始终开启的摄像头

理湃光晶完成新一轮融资,几何光波导全面引领AR产业爆发

用科技延伸仁心:创新工具守护生命健康

2025 AIRS香港科技峰会圆满落幕,勾勒“AI与机器人+”时代新图景

《铸魂·台湾光复》VR互动电影于台湾光复80周年“第十二届大江论坛”首展

M5 Apple Vision Pro现已上市,但M2型号无法以旧换新

王自如对话李宏伟:AR眼镜的“iPhone时刻”或在2027年

三星Galaxy XR可选追踪手柄已售罄,新用户或将等待三周以上

阿里巴巴将于24日零点开启夸克AI眼镜预售,平台补贴后最低3699元

亚马逊发布“Amelia”智能眼镜,内置显示屏和始终开启的摄像头

理湃光晶完成新一轮融资,几何光波导全面引领AR产业爆发

用科技延伸仁心:创新工具守护生命健康

2025 AIRS香港科技峰会圆满落幕,勾勒“AI与机器人+”时代新图景

《铸魂·台湾光复》VR互动电影于台湾光复80周年“第十二届大江论坛”首展

M5 Apple Vision Pro现已上市,但M2型号无法以旧换新

王自如对话李宏伟:AR眼镜的“iPhone时刻”或在2027年