【愚公系列】《AI漫剧创作一本通》037-AI漫剧未来展望（视频Agent与创作方式变革）-港品优选

💎【行业认证·权威头衔】
✔ 华为云天团核心成员：特约编辑/云享专家/开发者专家/产品云测专家
✔ 开发者社区全满贯：CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主
✔ 技术生态共建先锋：横跨鸿蒙、云计算、AI等前沿领域的技术布道者

🏆【荣誉殿堂】
🎖 连续三年蝉联"华为云十佳博主"（2022-2024）
🎖 双冠加冕CSDN"年度博客之星TOP2"（2022&2023）
🎖 十余个技术社区年度杰出贡献奖得主

📚【知识宝库】
覆盖全栈技术矩阵：
◾ 编程语言：.NET/Java/Python/Go/Node…
◾ 移动生态：HarmonyOS/iOS/Android/小程序
◾ 前沿领域：物联网/网络安全/大数据/AI/元宇宙
◾ 游戏开发：Unity3D引擎深度解析

文章目录

🚀前言
🚀一、视频Agent与创作方式变革
- 🔎1.主流视频Agent平台总览
- 🔎2.Seko 2.0
- - 🦋1. 软件特色：以流程整合为核心的视频Agent
  - 🦋2. 操作演示
  - 🦋3. 注意事项
- 🔎3.OiiOii
- - 🦋1. 快速生成视频模式
  - 🦋2. 剧情故事短片模式
  - 🦋3. 漫画转视频
  - 🦋4. 图片生成
  - 🦋5. 衍生品设计
  - 🦋6. 音乐概念短片
- 🔎4.TapNow
- 🔎5.Mulan

🚀前言

当AI 不再只是辅助工具，而是能够参与叙事、剪辑、生成角色与镜头时，一种介于动画、短剧与算法创作之间的新形态——AI 漫剧，正在逐渐成形。它不仅改变了内容呈现方式，也在重塑创作者与作品之间的关系。

🚀一、视频Agent与创作方式变革

AI漫剧的出现，并非某一个单点技术的突破，而是多种视频Agent能力叠加后的结果。从脚本生成、分镜设计，到角色驱动、画面合成与后期剪辑，视频Agent正在接管原本高度依赖人工的创作环节。

🔎1.主流视频Agent平台总览

本节介绍几个主要的AI视频Agent工具，能帮助创作者更快地生成高质量内容，如表9-1所示。

表9-1 主流的AI漫剧平台

产品	定位	核心特色	目标用户	优势	劣势
MulanAI	全自动AI视频生产制造厂	节点工作流+强Agent	专业创作者/团队	模板化工作流、节点可复制、Agent任务可追溯	结构复杂，学习成本高
OiiOii	全球首个动画创作Agent	托管模式+可爱风格	二次元/动画爱好者	多模板、批量修改分镜、全局角色库	偏二次元动画定位
Tapnow	连续创作无限画布	节点拖曳+拉片功能	创意探索者	连续创作体验、拖曳到对话框、分镜策划模板	内容过长时不便于查看
Seko 2.0	AI多剧集视频创作工具	视图切换+美感UI	漫剧/短剧创作者	设计美感、一键生成、可针对分镜优化	无参考生视频逻辑、画布无Agent
Medeo	对话式视频创作	聊天驱动+TodoList	效率型创作者	批量创作分镜、音乐节拍匹配、专业剪辑体验	/
Flova	每个人都是导演	故事板+时间线	通用创作者	模型丰富、首页可上传想法	/
纳米AI	分镜画布编辑	剪辑视图+无限画布	精细化创作者	分镜独立画布创作	整体流程分散
Aipai	双模式创作	Agent模式+标准模式	效率+精细兼顾	批量与精调分离、批量参考生视频	整体创作可视化不明显

笔者团队也陆续研发了AI视频的创作平台，如图9-1所示，用于快速生成AI短剧作品，有剧本拆分为分镜脚本、图片生成与视频生成以及视频预览等功能。

🔎2.Seko 2.0

很多人在制作AI漫剧的时候，有一种很明显的感觉：不是不会做，而是效率太低。

效率的卡点从不在生成视频，而是聚焦在视频制作前期的全流程——故事敲定、分镜拆解、风格统一、角色定型、节奏控制。当下可用的创作工具很多，但创作的各个环节中的工具相互割裂，每一步都要更换工具。创作者的核心精力，往往就在这样频繁的工具切换中被大量消耗。

正因如此，笔者始终在寻找一款并非单纯的模型套壳，而是能真正串联起AI漫剧全创作流程的平台。基于这一核心需求，笔者团队尝试了商汤Seko 2.0，其主页如图9-2所示。

🦋1. 软件特色：以流程整合为核心的视频Agent

Seko 2.0是商汤推出的一款面向剧情类视频创作的视频Agent，其核心特色并不在于单点生成能力，而在于对完整创作流程的整合设计。与传统“先画图、再剪辑、最后补剧情”的工具逻辑不同，Seko 2.0更强调从故事源头出发，对剧情、角色、场景和分镜进行统一管理。

在使用初期，系统会引导创作者先确认整体故事大纲，并支持多剧集结构。在此基础上，平台可自动生成故事梗概、美术风格设定、角色主体列表、场景列表以及分镜大纲。这一设计的核心价值在于，将原本依赖人工反复确认的前期策划工作，提前结构化、系统化，从而减少工具切换带来的效率损耗。

从定位上看，Seko 2.0更适合用于连续剧情、系列化AI漫剧或短剧内容的生产，而非单条视频或零散创作。

🦋2. 操作演示

Seko 2.0的操作逻辑并非从模型或参数开始，而是以“故事结构”为起点，整体流程更接近一套标准化的剧情制作管线。其完整使用过程可分为以下几个步骤。

（1）创建项目并确认整体剧情结构。

进入系统后，创作者首先需要创建项目，而不是直接进入生成界面。在项目创建阶段，需要先确认整体故事设定，包括剧情方向与是否采用多剧集结构，如图9-3所示。平台支持多剧集管理，适合连续剧情或系列化AI漫剧的创作需求。

这一阶段的核心目的是在生成任何画面之前，先锁定故事的整体走向和规模。

（2）生成并审核系统自动拆解内容。

在确认基础设定后，系统会基于输入信息自动生成一系列结构化内容，包括故事梗概、整体美术风格描述、角色主体列表、故事场景列表、分镜大纲等，如图9-4所示。

那一刻你会意识到，它想解决的不是画一张图，而是帮你把一个故事拆成能执行的结构。

创作者需要在这一阶段逐项检查这些内容是否符合预期，而不是直接进入生成阶段。此处的调整将直接影响后续分镜和画面的一致性，是整个流程中最关键的审核环节之一。

（3）确认角色主体并统一风格模型。

在主体确认阶段，创作者需要重点处理角色与风格的统一问题。平台支持切换不同的图片模型，但一旦切换模型，角色和场景会同步重新生成，如图9-5所示。

如果中途对某个主体不满意，也可以直接使用重新生成主体的功能，不需要将整条流程推翻重来，如图9-6所示。

这种设计将“风格一致性”前置为强制步骤，避免在后期通过反复“抽卡”或剪辑来弥补风格偏差。如果对某一角色主体不满意，可以使用“重新生成主体”功能单独调整，而无须推翻整个项目。

（4）生成分镜并选择合适的查看方式。

在完成主体确认后，即可进入分镜生成阶段。Seko 2.0支持一键生成分镜，生成速度较快，适合快速搭建剧情骨架。

分镜生成后，平台提供两种查看视图：默认分镜视图，更贴近剪辑逻辑，便于查看单个镜头内容；故事板视图，以整体故事推进为核心，更适合检查节奏密度和情节分布，如图9-7所示。

在实际使用中，建议先通过故事板视图从整体上判断剧情是否流畅、节奏是否合理，再进入默认视图对具体分镜进行调整，如图9-8所示。

（5）调整镜头节奏与分镜细节。

系统会根据分镜内容自动分配镜头时长，例如，在动作、奔跑等动态场景中主动加快节奏，而非平均分配时长。生成完成后，创作者仍可根据需要对镜头节奏进行人工干预，如图9-9所示。

左侧始终保留对话式Agent操作区，支持持续修改分镜内容、裁剪画面、调整文本描述，确保生成结果可被反复打磨，而非一次性输出。

（6）生成素材并进行可控修改。

在素材生成阶段，系统允许创作者在生成结果的基础上继续微调，包括分镜内容调整、画面裁剪，以及进一步的细节修正。即使在生成完成后，仍可通过对话式操作进行多轮优化，保证创作过程的可控性。

🦋3. 注意事项

从当前体验来看，Seko 2.0在人物一致性方面仍存在一定限制。若前期角色设定不够完整，或分镜中缺乏明确的角色参考，不同镜头、不同角度下的人物形象可能出现偏差。这一问题在多视角、高质量参考素材不足的情况下尤为明显。

此外，系统目前仍存在识别偏差的情况，例如，将音乐提示词误识别为旁白或字幕，生成结果需要人工检查与修正。因此，现阶段并不适合完全依赖“一键生成即成片”的使用方式。

在使用权限方面，非会员账号单次最多可生成30个分镜；年度高级会员支持更高分镜数量及多剧集创作，适合个人创作者或小型团队使用。从整体来看，Seko 2.0的目标用户更偏向高频剧情创作场景，而非轻量级尝试型用户。

最终我们制作了一个国风3D画风的霸王别姬和一个赛博朋克风格的故事，几乎都是一键生成，读者可以扫码观看整体效果。

🔎3.OiiOii

OiiOii是一款以“动画创作Agent”为核心定位的视频生成平台，其主要特点在于将动画短片的创作过程拆解为多个角色化的Agent，并以对话方式协同完成内容生产。官方将其定位为专业动画创作Agent，重点面向剧情类短片、动漫风格视频及概念动画的快速生成。

与传统单模型生成工具不同，OiiOii并非只提供“文生视频”能力，而是通过多个功能模块，覆盖从创意输入、角色设计、分镜拆解到成片输出的完整流程。平台支持调用多种主流视频与图像模型，在不同环节分别承担分镜生成、角色建模和画面输出任务。

从整体定位来看，OiiOii更偏向于将复杂动画制作流程“自动化拆解”，适合用于剧情短片、动漫二创、概念验证以及需要快速出样的创作场景，其主页如图9-10所示。

OiiOii主页清晰明了，它的特色功能主要包括快速生成视频、音乐概念短片、剧情故事短片、漫画转视频、衍生品设计等。下面展示几个主要功能的使用效果。

🦋1. 快速生成视频模式

进入平台首页后，选择“快速生成视频”模式。该模式主要用于生成时长约10s的短视频，适合快速验证创意或生成单一动作片段。

在输入框中填写动作或画面描述，同时可上传最多7张图片作为角色或风格参考图。例如，可上传已有动漫角色截图，用于约束人物外观，如图9-11所示。

该模式下无须设置额外参数，提交后系统将直接调用视频模型生成成片。生成结果以单段视频形式输出，适合对运镜和节奏要求不高的场景。扫码可观看生成视频。

🦋2. 剧情故事短片模式

剧情故事短片是OiiOii的核心功能，适合制作时长1min以上、具备完整叙事结构的动画内容。

在该模式下，创作者只需输入一段剧情创意或简要剧本，无须提前拆分分镜或角色设定。系统创建项目后，由“艺术总监Agent”引导创作者确认影片长度、画面比例、对白语言等基础参数，如图9-12所示。

平台会提供多种情绪选项，如仇恨、悲伤、紧张等。情绪设定将直接影响后续剧本结构和画面调性。系统还会提供上百种动漫风格选项，涵盖知名IP与代表性画风；也可通过文字自定义画风关键词，如图9-13所示。画风一经确定，将作为后续生成的统一风格基础。

基础信息确定好后，“艺术总监”就会邀请“编剧”上场了。“编剧Agent”会根据创意、情绪和画风生成完整剧本。创作者可通过对话方式进行多轮修改，如图9-14所示。

然后，“角色设计师Agent”会基于剧本生成主要角色形象，并输出角色三视图。若对形象不满意，可持续对话修改，直到确认，如图9-15所示。

最后，“分镜师Agent”将根据剧本自动拆解分镜，并调用视频模型生成对应片段。每个分镜均可单独预览、编辑或重新生成，如图9-16所示。

最后的成品可扫码观看。

总之，这种模式在批量化制作漫剧、短剧，或是快速向客户展示创意等诸多场景中，都具有极高的应用价值。

在剧情故事短片功能中，可以上传一些动漫IP角色图用于生成短片，如图9-17所示。

🦋3. 漫画转视频

上传漫画页面，将静态画面转换为动画片段，如图9-18所示。

🦋4. 图片生成

通过对话生成插画，支持生成匹配角色风格的参考图，如图9-19所示。

🦋5. 衍生品设计

基于角色形象生成周边设计，如徽章、抱枕等，如图9-20所示。

🦋6. 音乐概念短片

OiiOii擅长制作动漫类MV，选择“音乐概念短片”模式即可，如图9-21所示。用户可以不上传任何图片，只通过提示词来生成一个有创意的短片。

我们用OiiOii制作的短片成品展示，可扫码观看。

🔎4.TapNow

TapNow是一款面向商业创作场景的AI视觉内容生产平台，重点服务于中长视频、剧情类项目及高质量商业视频的制作需求。与偏“单次生成”的视频工具不同，TapNow更强调连续创作、流程管理与多节点协同，整体设计思路更接近专业影视制作软件与Agent的结合体。

平台支持从角色设计、分镜策划到视频生成的完整流程，并通过可视化节点和模板系统，将复杂的视频制作过程拆解为可反复调用的创作单元。这种结构化设计，使其更适合用于商业项目、系列内容或需要多人协作的创作场景。

平台首页公开了非常多优秀视频的创作过程，如图9-22所示，读者可以跟随着创作者的思路，去看看这些作品的主要创作过程。

TapNow的整体生成效果很不错，下面总结几个实用的功能场景。

（1）支持连续性创作流程，从角色设计到分镜规划，再到场景视频生成，整体流程衔接顺畅，适合中长视频内容的制作需求，如图9-23所示。

（2）平台提供分组功能、首尾帧设置功能，并支持一次性提示词描述多次生成，有助于在同一分镜下对不同生成结果进行对比和筛选，如图9-24所示。

（3）内置“一键拉片”“分镜策划”等专属模板功能，能够在一定程度上降低复杂视频项目的前期规划成本，如图9-25所示。

（4）支持将图片或视频节点直接拖入对话框，系统可基于节点内容生成或补全提示词。这种方式相当于为对话式创作引入上下文，有助于在复杂项目中保持内容的一致性，如图9-26所示。

TapNow的劣势是当项目内容较长时，整体查看项目内容和快速定位仍存在一定不便。不过从当前主流使用场景来看，大多数创作者并不会频繁制作极长篇幅的内容，因此该问题在现阶段对实际创作影响相对有限。

🔎5.Mulan

Mulan是一款以对话驱动为核心的AI内容创作平台，其突出特点在于能够通过自然语言交互，自动生成可视化的工作流结构。创作者无须手动搭建复杂节点，即可在对话过程中逐步形成完整的创作流程，整体逻辑清晰，操作路径直观。

相较于以节点配置为主的传统工具，Mulan将工作流构建前置为系统能力，使创作者能够更专注于内容本身，而非工具参数的组合与调试，其工作过程如图9-27所示。

从实际使用场景来看，Mulan更适合以下几类用户。

在使用ComfyUI、n8n、扣子等流程型工具进行AI图像或视频创作时存在一定学习成本，希望通过更简化方式完成内容生成的用户。
需要批量生成风格统一、质量稳定的视频内容，例如，用于TikTok电商、企业社交媒体营销矩阵等场景的创作者或团队。
从事品牌营销、教育培训、AI短剧及AI短视频等需要持续输出内容的机构或个人。
有明确宣传需求，但预算有限，希望通过AI工具降低视频制作成本的小微企业主。
具有其他非标准化需求的长尾创作场景用户。

从产品定位来看，Mulan当前更偏向于通用型AI内容创作平台，而非专门面向AI漫剧的垂直Agent。其优势在于覆盖场景较广泛，能够满足多种类型内容的生成需求。

在功能层面，Mulan已具备与TapNow相近的核心能力，同时通过对话方式生成工作流，使其在使用门槛上明显低于ComfyUI、n8n、扣子等偏工程化的工具；相较于TapNow等流程较为固定的平台，Mulan在创作自由度上也更具灵活性。

总体而言，Mulan更适合作为一款低门槛、强扩展的通用创作工具，服务于对流程可控性和创作效率均有要求的用户群体。

企业官网建设流程全解析

文章目录

🚀前言

🚀一、视频Agent与创作方式变革

🔎1.主流视频Agent平台总览

🔎2.Seko 2.0

🦋1. 软件特色：以流程整合为核心的视频Agent

🦋2. 操作演示

🦋3. 注意事项

🔎3.OiiOii

🦋1. 快速生成视频模式

🦋2. 剧情故事短片模式

🦋3. 漫画转视频

🦋4. 图片生成

🦋5. 衍生品设计

🦋6. 音乐概念短片

🔎4.TapNow

🔎5.Mulan

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

文章目录

🚀前言

🚀一、视频Agent与创作方式变革

🔎1.主流视频Agent平台总览

🔎2.Seko 2.0

🦋1. 软件特色：以流程整合为核心的视频Agent

🦋2. 操作演示

🦋3. 注意事项

🔎3.OiiOii

🦋1. 快速生成视频模式

🦋2. 剧情故事短片模式

🦋3. 漫画转视频

🦋4. 图片生成

🦋5. 衍生品设计

🦋6. 音乐概念短片

🔎4.TapNow

🔎5.Mulan

热门文章

文章分类

标签云

相关文章

Win10黑屏只剩鼠标？别急着重装！用这条sfc命令5分钟救活你的桌面

IDEA 中进行git分支双向同步操作指南

Windows + Codex + Deepseek-v4-pro配置教程

需要专业的网站建设服务？