阿里通义万相开源业内首个首尾帧生视频模型_陀螺科技

我要发布

阿里通义万相开源业内首个首尾帧生视频模型

前方智能原创 2025-04-18 10:01 热度 43243

分享

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：广东

文章AI导读

一键萃取文章精髓，核心观点即刻呈现

# 梳理该事件的完整脉络

# 该文章有哪些有意思的观点或数据

# 大家对该事件的态度表现如何？

日前，阿里通义万相宣布开源业界首个百亿参数规模的首尾帧生视频模型Wan2.1-FLF2V-14B，可根据用户提供指定的开始和结束图片，生成一段衔接首尾画面的720p高清视频。

图源：网络

基于现有的Wan2.1文生视频基础模型架构，通义万相首尾帧生视频模型进一步引入了额外的条件控制机制，通过该机制可实现流畅且精准的首尾帧变换。

在推理阶段，为了在有限内存资源的条件下支持高清视频推理，通义万相首尾帧生视频模型分别采用了模型切分策略以及序列并行策略，在确保推理效果无损的前提下，显著缩短了推理时间。

基于该模型，用户可完成更复杂、更个性化的视频生成任务，可以实现同一主体的特效变化、不同场景的运镜控制等视频生成。

目前，阿里首尾帧生视频模型已经上线通义万相官网并可直接免费体验，或在Github、Hugging Face、魔搭社区下载模型进行本地部署。

模型视频首尾

陀螺科技现已开放专栏入驻，详情请见入驻指南： https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏： https://www.tuoluo.cn/columns/author1911845/

本文网址： https://www.tuoluo.cn/article/detail-10121446.html

免责声明：
1、本文版权归原作者所有，仅代表作者本人观点，不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为，侵权责任将由作者本人承担。

上一篇： OpenAI 拟 30 亿美元收购 Windsurf

下一篇：「SLG + X」再添一员“猛将”：两月内挺进美国iOS游戏畅销榜Top 50

相关文章

解读ChatGPT Atlas背后的数据边界之战

大模型炒币谁最强，国产 AI 竟遥遥领先？

微软发布自研图像生成模型 MAI-Image-1

一根香蕉引发的AI狂潮

AI芯天下丨产业丨2025中国产业AI以小模型破局，欲叩...

B站成了千禧年的影像博物馆