编译 / VRAR星球 R星人
在4月27日举办的2024中关村论坛年会未来人工智能先锋论坛上,清华大学联合生数科技正式发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。

图源:中新网
据了解,该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。Vidu是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。
在当天的论坛上,清华大学教授、生数科技首席科学家朱军表示,与Sora一致,Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。除了在时长方面的突破外,Vidu在视频效果方面实现显著提升,主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。
商务合作:13146398132
媒体合作:13341147250
爆料投稿:editor@vrarworld.cn
版权声明:本文为VRAR星球原创,任何单位及个人未经授权不得转载,否则将依法追究侵权责任。
如需转载请联系13341147250 / editor@vrarworld.cn 申请授权,转载时请注明来源并保留VRAR星球原文链接。
本文部分图片及视频来源于互联网,如涉及侵权请联系我们删除。

NIMO首款智能眼镜即将发布:0.03cc光机,挑战全天候佩戴

visionOS 26.4发布,新增VR注视点流传输和改进的空间音频功能

带近视镜片的Ray-Ban智能眼镜将于本周上市

《2026 XR行业发展白皮书》即将发布!解码AI+XR如何重塑下一个万亿市场

AI眼镜助力,第十九届环湘自行车赛骑游首站永州启幕

“AI交警”、AR眼镜齐亮相,杭州黑科技护航城市马拉松

山东企业携“孔子”亮相中国科幻大会,VR技术带你一秒“穿越千年”

韩国科学技术院研发出用于高分辨率VR显示器的超低功耗单像素技术

日本公司Kaedear开发出可“一机四用”的KDR‑BH2 抬头显示器

NIMO首款智能眼镜即将发布:0.03cc光机,挑战全天候佩戴

visionOS 26.4发布,新增VR注视点流传输和改进的空间音频功能

带近视镜片的Ray-Ban智能眼镜将于本周上市

《2026 XR行业发展白皮书》即将发布!解码AI+XR如何重塑下一个万亿市场

AI眼镜助力,第十九届环湘自行车赛骑游首站永州启幕

“AI交警”、AR眼镜齐亮相,杭州黑科技护航城市马拉松

山东企业携“孔子”亮相中国科幻大会,VR技术带你一秒“穿越千年”

韩国科学技术院研发出用于高分辨率VR显示器的超低功耗单像素技术

日本公司Kaedear开发出可“一机四用”的KDR‑BH2 抬头显示器