街坊秀 街坊秀

当前位置: 首页 » 街坊资讯 »

阿里万相视频生成模型开源 消费级显卡也能跑

每经记者 叶晓丹    每经编辑 陈俊杰    

每经杭州2月25日电(记者 叶晓丹)阿里云旗下视觉生成基座模型万相2.1(Wan)开源,此次开源采用最宽松的Apache 2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace和魔搭社区下载体验。

据阿里云方面介绍,14B万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集VBench中,万相2.1以总分86.22%的成绩大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。1.3B版本测试结果不仅超过了更大尺寸的开源模型,甚至还接近部分闭源模型,同时能在消费级显卡运行,仅需8.2GB显存就可以生成高质量视频,适用于二次模型开发和学术研究。

未经允许不得转载: 街坊秀 » 阿里万相视频生成模型开源 消费级显卡也能跑