Wan2.7-Video

Wan2.7-Video – 阿里通义推出的 AI 视频创作模型

Wan2.7-Video：阿里通义实验室革新视频创作的AI利器

在人工智能飞速发展的今天，视频内容的创作门槛正被不断打破。阿里通义实验室推出的Wan2.7-Video，一款强大的AI视频创作大模型，正引领着一场视频创作的。它不仅支持文本、图像、视频、音频等全模态输入，更以其“像修图一样修视频”的独特理念，实现了对视频创作全流程的深度赋能。

Wan2.7-Video是何方神圣？

Wan2.7-Video是阿里通义实验室倾力打造的一款性AI视频创作大模型。它拥抱全模态输入，无论是文字描述、静态图片、已有视频片段还是声音素材，都能成为其创作的起点。该模型的核心突破在于其“局部编辑”能力，颠覆了传统视频生成只能从头开始的模式，让用户能够如同编辑图片般，对视频的特定区域进行精细化修改。从调整台词和角色动作，到复刻复杂的镜头语言，再到续写故事情节，Wan2.7-Video覆盖了视频创作的每一个环节。模型还支持多达5个主体角色的控制，以及直观的多宫格故事板功能。通过“戏核”驱动，它能够生成专业的镜头语言、丰富的表情变化，并实现电影级的运镜效果，极大地降低了专业视频制作的门槛。

Wan2.7-Video的核心功能亮点

精细入微的局部编辑：用户只需通过简单的指令，便可对视频画面进行精准的局部调整，例如增加或移除画面元素、替换特定物体，或是修改其属性。更令人惊叹的是，编辑后的光影效果和材质表现能够与原视频无缝融合，浑然一体。
随心所欲的环境风格变换：在保持人物动作自然流畅的前提下，Wan2.7-Video能够一键切换视频的背景季节，或将整个画面风格转换为羊毛毡、赛博朋克等多元化的艺术效果，为视频增添无限创意。
灵活的剧情拍摄修改：告别繁琐的重来。用户可以通过指令轻松调整角色的台词，并自动匹配口型与情绪，甚至修改角色的行为动作，或变更镜头视角和类型，实现视频内容的灵活二次创作。
引人入胜的剧情续写：通过首尾帧的巧妙结合，模型能够在保留视频动态自然延续性的基础上，精准控制画面结构，实现剧情的无缝衔接与精彩延展。
创意元素的快速复用：该系统支持用户保留原视频的动作序列、镜头轨迹或独特的风格特效，并将其快速应用到全新的场景中，实现动态创意的即时复用。
多主体角色的精准控制：支持用户上传最多5个主体的图像、视频和音频参考，模型能够精准锁定角色的外貌特征和专属音色，确保在多镜头切换时，角色的特征保持高度一致性。
故事板级别的分镜掌控：用户可以通过多宫格参考图，清晰地规划故事走向、镜头构图和角色设定，实现对分镜的精准执行。
智能化的剧本生成：基于对专业剧本的深度学习，模型能够根据用户的一句话创意，自动生成符合戏剧逻辑的叙事结构（起承转合）和专业的镜头脚本。
电影级的风格化控制：以“戏核”为驱动，模型可以直接生成对应的光影、摄影和色彩参数，支持上千种电影级风格的组合，并确保多镜头间风格的一致性。
专业级的运镜执行：系统能够精准模拟和执行希区柯克变焦、上升揭示等复杂而经典的复合运镜技巧。
细腻生动的表情与声音演绎：模型支持演绎超过40种细致的表情变化，生成的台词准确且声音自然生动，通过先进的音画同步技术，呈现出富有质感的专业表演。

如何开启Wan2.7-Video的创作之旅？

阿里云百炼平台：访问阿里云百炼，在模型广场中找到Wan系列模型，即可通过API接口调用或直接在网页端进行体验。
万相官网：直接访问通义万相官网，那里提供了直观的可视化操作界面，用户可以轻松上传素材进行创作。
便捷的使用方式：Wan2.7-Video支持文本、图像、视频、音频的全模态输入。用户只需通过自然语言指令，便可灵活控制画面结构、剧情发展、局部细节以及时序变化，完成生成、编辑、复刻、续写等全流程创作。

Wan2.7-Video的关键信息与使用要求

研发团队：阿里通义实验室
产品定位：一款集视频生成、编辑、复刻、续写、重塑于一体的全流程AI视频创作套件。
输入模态：全面支持文本、图像、视频、音频的任意组合输入。
主体控制能力：最多支持5个主体角色的外貌和音色锁定，确保多镜头下的角色一致性。
核心能力亮点：具备局部精准编辑、剧情/台词/机位修改、动作运镜复刻、剧情续写以及故事板分镜控制等强大功能。
表演能力：支持40余种细致表情，台词生成准确，声音自然且与画面高度同步。
运镜支持：涵盖数十种基础运镜（如推、拉、摇、移）以及复杂的电影级复合运镜技巧（如希区柯克变焦、上升揭示）。
访问渠道：可通过阿里云百炼或万相官网进行访问。
操作方式：全程采用自然语言指令控制，无需任何编程基础。

Wan2.7-Video的突出优势

全模态输入的深度融合：支持文本、图像、视频、音频的任意组合输入，用户能够通过多种方式全方位地控制画面结构、剧情走向、细节呈现和时序变化。
覆盖创作全链路的工具集：从视频的初步生成，到精细的局部编辑，再到创意的复刻、剧情的延展和角色的重塑，Wan2.7-Video提供了一套完整的工具链，用户无需在多个平台间切换，即可完成所有创作步骤。
突破性的局部精准编辑：区别于传统的全局重生成模式，Wan2.7-Video支持指令级的元素增删、物体替换和属性修改。编辑区域的光影和材质能够与原视频自然融合，真正实现了“像修图一样修视频”的便捷体验。
对拍摄与剧情的强大掌控力：无需从头开始，用户可以通过简单指令调整角色台词（并自动匹配口型与音色），修改行为动作，甚至变更机位视角和镜头类型，赋予视频创作前所未有的灵活性。
多主体一致性的高度保障：最多支持5个主体的外貌和音色锁定，确保同一角色在不同镜头下都能保持高度一致的视觉和听觉特征，每个角色都能拥有其专属的声音表现。

Wan2.7-Video与其他竞品的比较

对比维度	Wan2.7-Video	Runway Gen-4	快手 Kling 2.6
开发方	阿里通义实验室	Runway（美国）	快手大模型团队
开源性	✅ Apache 2.0 开源	❌ 闭源订阅制	❌ 闭源（国内版/国际版）
视频时长	最长 15 秒	最长 16 秒（Gen-3）	最长 3 分钟（可延长）
核心优势	全流程可控创作（编辑/复刻/续写）	专业工具链与精细控制	动作控制与超长视频生成
角色一致性	最多 5 主体锁定，多镜头外貌+音色一致	角色一致性功能，支持多镜头	角色特征保持较好
动作控制	支持动作参考复刻，40+种表情	Motion Brush 笔刷，精准控制轨迹	最强，3-30秒视频精准复刻舞蹈/武术
视频编辑	最强，支持局部增删改、台词修改	Magic Tools（绿幕、修复、重绘）	基础编辑功能
生成成本	最低（Fast版约 $0.01-0.02/秒）	高（约 $0.25-0.50/秒，订阅 $12-28/月）	中等（Pro约 $0.48-0.95/秒）
文本生成	支持生成可读文字	支持	支持文字生成
分镜控制	多宫格故事板，戏核驱动分镜	Director Mode 导演模式	有限分镜控制
适用场景	专业影视预演、多角色剧情、广告迭代	好莱坞级广告、时尚短片、专业影视后期	短视频动作复刻、长视频生成

Wan2.7-Video的应用场景探索

影视内容创作的低成本解决方案：无论是电影、短片还是动画制作，Wan2.7-Video都能显著降低成本。它能够快速将剧本可视化，用于故事板分镜的呈现，甚至可以在正式拍摄前进行动态预演和镜头测试。
短视频与社交媒体的创意工厂：内容创作者可以利用Wan2.7-Video快速生成各种类型的短视频，如剧情类、变装类或特效类。它还支持热门运镜的复刻和多角色剧情的演绎，完美契合抖音、快手、Instagram等平台的创作需求。
广告与电商营销的快速迭代：在产品展示视频的制作和迭代方面，Wan2.7-Video展现出巨大优势。它支持局部编辑替换商品元素、调整拍摄机位，并能实现虚拟模特的多角度展示和口播配音，极大地提升了营销效率。
教育培训领域的生动呈现：制作教学演示视频、历史场景还原或实验过程可视化，Wan2.7-Video都游刃有余。其剧情续写功能还能构建连贯的知识讲解序列，增强学习的趣味性和直观性。
音乐与娱乐内容的视觉升级：在MV制作中，Wan2.7-Video能够实现特定风格化视觉效果（如羊毛毡、赛博朋克），复刻舞蹈动作，模拟运镜参考，并保证虚拟歌手多镜头的表演一致性，为音乐作品增添视觉冲击力。

阅读原文