2月25日晚,阿里巴巴宣布全面开源旗下视频生成模型万相2.1模型。据介绍,此次开源基于Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace和魔搭社区下载体验。

通义万相是阿里云通义系列AI绘画创作大模型,可辅助人类进行图片创作,于2023年7月7日正式上线。在2024年9月19日的阿里云栖大会上,阿里发布了通义万相视频生成大模型。
在视频生成方面,通义万相 2.1 通过自研的高效 VAE 和 DiT 架构增强了时空上下文建模能力,支持无限长 1080P 视频的高效编解码,首次实现了中文文字视频生成功能,登上 VBench 榜单第一。
据介绍,通义万相 2.1 支持中英文视频,都可以一键生成艺术字,还提供多种视频特效选项,以增强视觉表现力,例如过渡、粒子效果、模拟等等。其还支持复杂运镜,可还原碰撞、反弹、切割、挤压等真实世界的物理规律,例如雨滴落在伞上会溅起水花。
官方曾表示,通义万相 2.1 支持中英文一键生成艺术字,还提供了多种视频特效选项,如过渡、粒子效果、模拟等等。(新闻来源:IT之家)
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

爱立信与软银、高通深挖“智能眼镜+5G”融合潜力

亮亮视野首季订单密集排产,AR翻译眼镜全球布局提速

消息称vivo叫停AI眼镜项目,此前已秘密筹备半年时间

破解智能交互难题:中兴通讯AI+VR大空间带你走进传世名画《韩熙载夜宴图》

Snapchat在澳大利亚网球公开赛为观众带来沉浸式AR体验

2026年首张VR电影龙标诞生!|《摇啊摇·1995》VR音乐电影荣获2026年电影龙标“虚字001号”!

大朋VR入选NIQ×36氪「2025国货未来超级品牌」

复旦大学最新Nature论文:首个“纤维芯片”助力脑机接口/智能织物/VR设备发展

海信视像:公司在AR及AI眼镜等与显示深度交互的新兴赛道持续进行战略布局

爱立信与软银、高通深挖“智能眼镜+5G”融合潜力

亮亮视野首季订单密集排产,AR翻译眼镜全球布局提速

消息称vivo叫停AI眼镜项目,此前已秘密筹备半年时间

破解智能交互难题:中兴通讯AI+VR大空间带你走进传世名画《韩熙载夜宴图》

Snapchat在澳大利亚网球公开赛为观众带来沉浸式AR体验

2026年首张VR电影龙标诞生!|《摇啊摇·1995》VR音乐电影荣获2026年电影龙标“虚字001号”!

大朋VR入选NIQ×36氪「2025国货未来超级品牌」

复旦大学最新Nature论文:首个“纤维芯片”助力脑机接口/智能织物/VR设备发展

海信视像:公司在AR及AI眼镜等与显示深度交互的新兴赛道持续进行战略布局