💎【行业认证·权威头衔】
✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家
✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主
✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者
🏆【荣誉殿堂】
🎖 连续三年蝉联"华为云十佳博主"(2022-2024)
🎖 双冠加冕CSDN"年度博客之星TOP2"(2022&2023)
🎖 十余个技术社区年度杰出贡献奖得主
📚【知识宝库】
覆盖全栈技术矩阵:
◾ 编程语言:.NET/Java/Python/Go/Node…
◾ 移动生态:HarmonyOS/iOS/Android/小程序
◾ 前沿领域:物联网/网络安全/大数据/AI/元宇宙
◾ 游戏开发:Unity3D引擎深度解析
文章目录
- 🚀前言
- 🚀一、视频Agent与创作方式变革
- 🔎1.主流视频Agent平台总览
- 🔎2.Seko 2.0
- 🦋1. 软件特色:以流程整合为核心的视频Agent
- 🦋2. 操作演示
- 🦋3. 注意事项
- 🔎3.OiiOii
- 🦋1. 快速生成视频模式
- 🦋2. 剧情故事短片模式
- 🦋3. 漫画转视频
- 🦋4. 图片生成
- 🦋5. 衍生品设计
- 🦋6. 音乐概念短片
- 🔎4.TapNow
- 🔎5.Mulan
🚀前言
当AI 不再只是辅助工具,而是能够参与叙事、剪辑、生成角色与镜头时, 一种介于动画、短剧与算法创作之间的新形态——AI 漫剧,正在逐渐成形。它 不仅改变了内容呈现方式,也在重塑创作者与作品之间的关系。
🚀一、视频Agent与创作方式变革
AI漫剧的出现,并非某一个单点技术的突破,而是多种视频Agent能力叠加后的结果。从脚本生成、分镜设计,到角色驱动、画面合成与后期剪辑,视频Agent正在接管原本高度依赖人工的创作环节。
🔎1.主流视频Agent平台总览
本节介绍几个主要的AI视频Agent工具,能帮助创作者更快地生成高质量内容,如表9-1所示。
表9-1 主流的AI漫剧平台
| 产品 | 定位 | 核心特色 | 目标用户 | 优势 | 劣势 |
|---|---|---|---|---|---|
| MulanAI | 全自动AI视频生产制造厂 | 节点工作流+强Agent | 专业创作者/团队 | 模板化工作流、节点可复制、Agent任务可追溯 | 结构复杂,学习成本高 |
| OiiOii | 全球首个动画创作Agent | 托管模式+可爱风格 | 二次元/动画爱好者 | 多模板、批量修改分镜、全局角色库 | 偏二次元动画定位 |
| Tapnow | 连续创作无限画布 | 节点拖曳+拉片功能 | 创意探索者 | 连续创作体验、拖曳到对话框、分镜策划模板 | 内容过长时不便于查看 |
| Seko 2.0 | AI多剧集视频创作工具 | 视图切换+美感UI | 漫剧/短剧创作者 | 设计美感、一键生成、可针对分镜优化 | 无参考生视频逻辑、画布无Agent |
| Medeo | 对话式视频创作 | 聊天驱动+TodoList | 效率型创作者 | 批量创作分镜、音乐节拍匹配、专业剪辑体验 | / |
| Flova | 每个人都是导演 | 故事板+时间线 | 通用创作者 | 模型丰富、首页可上传想法 | / |
| 纳米AI | 分镜画布编辑 | 剪辑视图+无限画布 | 精细化创作者 | 分镜独立画布创作 | 整体流程分散 |
| Aipai | 双模式创作 | Agent模式+标准模式 | 效率+精细兼顾 | 批量与精调分离、批量参考生视频 | 整体创作可视化不明显 |
笔者团队也陆续研发了AI视频的创作平台,如图9-1所示,用于快速生成AI短剧作品,有剧本拆分为分镜脚本、图片生成与视频生成以及视频预览等功能。
🔎2.Seko 2.0
很多人在制作AI漫剧的时候,有一种很明显的感觉:不是不会做,而是效率太低。
效率的卡点从不在生成视频,而是聚焦在视频制作前期的全流程——故事敲定、分镜拆解、风格统一、角色定型、节奏控制。当下可用的创作工具很多,但创作的各个环节中的工具相互割裂,每一步都要更换工具。创作者的核心精力,往往就在这样频繁的工具切换中被大量消耗。
正因如此,笔者始终在寻找一款并非单纯的模型套壳,而是能真正串联起AI漫剧全创作流程的平台。基于这一核心需求,笔者团队尝试了商汤Seko 2.0,其主页如图9-2所示。
🦋1. 软件特色:以流程整合为核心的视频Agent
Seko 2.0是商汤推出的一款面向剧情类视频创作的视频Agent,其核心特色并不在于单点生成能力,而在于对完整创作流程的整合设计。与传统“先画图、再剪辑、最后补剧情”的工具逻辑不同,Seko 2.0更强调从故事源头出发,对剧情、角色、场景和分镜进行统一管理。
在使用初期,系统会引导创作者先确认整体故事大纲,并支持多剧集结构。在此基础上,平台可自动生成故事梗概、美术风格设定、角色主体列表、场景列表以及分镜大纲。这一设计的核心价值在于,将原本依赖人工反复确认的前期策划工作,提前结构化、系统化,从而减少工具切换带来的效率损耗。
从定位上看,Seko 2.0更适合用于连续剧情、系列化AI漫剧或短剧内容的生产,而非单条视频或零散创作。
🦋2. 操作演示
Seko 2.0的操作逻辑并非从模型或参数开始,而是以“故事结构”为起点,整体流程更接近一套标准化的剧情制作管线。其完整使用过程可分为以下几个步骤。
(1)创建项目并确认整体剧情结构。
进入系统后,创作者首先需要创建项目,而不是直接进入生成界面。在项目创建阶段,需要先确认整体故事设定,包括剧情方向与是否采用多剧集结构,如图9-3所示。平台支持多剧集管理,适合连续剧情或系列化AI漫剧的创作需求。
这一阶段的核心目的是在生成任何画面之前,先锁定故事的整体走向和规模。
(2)生成并审核系统自动拆解内容。
在确认基础设定后,系统会基于输入信息自动生成一系列结构化内容,包括故事梗概、整体美术风格描述、角色主体列表、故事场景列表、分镜大纲等,如图9-4所示。
那一刻你会意识到,它想解决的不是画一张图,而是帮你把一个故事拆成能执行的结构。
创作者需要在这一阶段逐项检查这些内容是否符合预期,而不是直接进入生成阶段。此处的调整将直接影响后续分镜和画面的一致性,是整个流程中最关键的审核环节之一。
(3)确认角色主体并统一风格模型。
在主体确认阶段,创作者需要重点处理角色与风格的统一问题。平台支持切换不同的图片模型,但一旦切换模型,角色和场景会同步重新生成,如图9-5所示。
如果中途对某个主体不满意,也可以直接使用重新生成主体的功能,不需要将整条流程推翻重来,如图9-6所示。
这种设计将“风格一致性”前置为强制步骤,避免在后期通过反复“抽卡”或剪辑来弥补风格偏差。如果对某一角色主体不满意,可以使用“重新生成主体”功能单独调整,而无须推翻整个项目。
(4)生成分镜并选择合适的查看方式。
在完成主体确认后,即可进入分镜生成阶段。Seko 2.0支持一键生成分镜,生成速度较快,适合快速搭建剧情骨架。
分镜生成后,平台提供两种查看视图:默认分镜视图,更贴近剪辑逻辑,便于查看单个镜头内容;故事板视图,以整体故事推进为核心,更适合检查节奏密度和情节分布,如图9-7所示。
在实际使用中,建议先通过故事板视图从整体上判断剧情是否流畅、节奏是否合理,再进入默认视图对具体分镜进行调整,如图9-8所示。
(5)调整镜头节奏与分镜细节。
系统会根据分镜内容自动分配镜头时长,例如,在动作、奔跑等动态场景中主动加快节奏,而非平均分配时长。生成完成后,创作者仍可根据需要对镜头节奏进行人工干预,如图9-9所示。
左侧始终保留对话式Agent操作区,支持持续修改分镜内容、裁剪画面、调整文本描述,确保生成结果可被反复打磨,而非一次性输出。
(6)生成素材并进行可控修改。
在素材生成阶段,系统允许创作者在生成结果的基础上继续微调,包括分镜内容调整、画面裁剪,以及进一步的细节修正。即使在生成完成后,仍可通过对话式操作进行多轮优化,保证创作过程的可控性。
🦋3. 注意事项
从当前体验来看,Seko 2.0在人物一致性方面仍存在一定限制。若前期角色设定不够完整,或分镜中缺乏明确的角色参考,不同镜头、不同角度下的人物形象可能出现偏差。这一问题在多视角、高质量参考素材不足的情况下尤为明显。
此外,系统目前仍存在识别偏差的情况,例如,将音乐提示词误识别为旁白或字幕,生成结果需要人工检查与修正。因此,现阶段并不适合完全依赖“一键生成即成片”的使用方式。
在使用权限方面,非会员账号单次最多可生成30个分镜;年度高级会员支持更高分镜数量及多剧集创作,适合个人创作者或小型团队使用。从整体来看,Seko 2.0的目标用户更偏向高频剧情创作场景,而非轻量级尝试型用户。
最终我们制作了一个国风3D画风的霸王别姬和一个赛博朋克风格的故事,几乎都是一键生成,读者可以扫码观看整体效果。
🔎3.OiiOii
OiiOii是一款以“动画创作Agent”为核心定位的视频生成平台,其主要特点在于将动画短片的创作过程拆解为多个角色化的Agent,并以对话方式协同完成内容生产。官方将其定位为专业动画创作Agent,重点面向剧情类短片、动漫风格视频及概念动画的快速生成。
与传统单模型生成工具不同,OiiOii并非只提供“文生视频”能力,而是通过多个功能模块,覆盖从创意输入、角色设计、分镜拆解到成片输出的完整流程。平台支持调用多种主流视频与图像模型,在不同环节分别承担分镜生成、角色建模和画面输出任务。
从整体定位来看,OiiOii更偏向于将复杂动画制作流程“自动化拆解”,适合用于剧情短片、动漫二创、概念验证以及需要快速出样的创作场景,其主页如图9-10所示。
OiiOii主页清晰明了,它的特色功能主要包括快速生成视频、音乐概念短片、剧情故事短片、漫画转视频、衍生品设计等。下面展示几个主要功能的使用效果。
🦋1. 快速生成视频模式
进入平台首页后,选择“快速生成视频”模式。该模式主要用于生成时长约10s的短视频,适合快速验证创意或生成单一动作片段。
在输入框中填写动作或画面描述,同时可上传最多7张图片作为角色或风格参考图。例如,可上传已有动漫角色截图,用于约束人物外观,如图9-11所示。
该模式下无须设置额外参数,提交后系统将直接调用视频模型生成成片。生成结果以单段视频形式输出,适合对运镜和节奏要求不高的场景。扫码可观看生成视频。
🦋2. 剧情故事短片模式
剧情故事短片是OiiOii的核心功能,适合制作时长1min以上、具备完整叙事结构的动画内容。
在该模式下,创作者只需输入一段剧情创意或简要剧本,无须提前拆分分镜或角色设定。系统创建项目后,由“艺术总监Agent”引导创作者确认影片长度、画面比例、对白语言等基础参数,如图9-12所示。
平台会提供多种情绪选项,如仇恨、悲伤、紧张等。情绪设定将直接影响后续剧本结构和画面调性。系统还会提供上百种动漫风格选项,涵盖知名IP与代表性画风;也可通过文字自定义画风关键词,如图9-13所示。画风一经确定,将作为后续生成的统一风格基础。
基础信息确定好后,“艺术总监”就会邀请“编剧”上场了。“编剧Agent”会根据创意、情绪和画风生成完整剧本。创作者可通过对话方式进行多轮修改,如图9-14所示。
然后,“角色设计师Agent”会基于剧本生成主要角色形象,并输出角色三视图。若对形象不满意,可持续对话修改,直到确认,如图9-15所示。
最后,“分镜师Agent”将根据剧本自动拆解分镜,并调用视频模型生成对应片段。每个分镜均可单独预览、编辑或重新生成,如图9-16所示。
最后的成品可扫码观看。
总之,这种模式在批量化制作漫剧、短剧,或是快速向客户展示创意等诸多场景中,都具有极高的应用价值。
在剧情故事短片功能中,可以上传一些动漫IP角色图用于生成短片,如图9-17所示。
🦋3. 漫画转视频
上传漫画页面,将静态画面转换为动画片段,如图9-18所示。
🦋4. 图片生成
通过对话生成插画,支持生成匹配角色风格的参考图,如图9-19所示。
🦋5. 衍生品设计
基于角色形象生成周边设计,如徽章、抱枕等,如图9-20所示。
🦋6. 音乐概念短片
OiiOii擅长制作动漫类MV,选择“音乐概念短片”模式即可,如图9-21所示。用户可以不上传任何图片,只通过提示词来生成一个有创意的短片。
我们用OiiOii制作的短片成品展示,可扫码观看。
🔎4.TapNow
TapNow是一款面向商业创作场景的AI视觉内容生产平台,重点服务于中长视频、剧情类项目及高质量商业视频的制作需求。与偏“单次生成”的视频工具不同,TapNow更强调连续创作、流程管理与多节点协同,整体设计思路更接近专业影视制作软件与Agent的结合体。
平台支持从角色设计、分镜策划到视频生成的完整流程,并通过可视化节点和模板系统,将复杂的视频制作过程拆解为可反复调用的创作单元。这种结构化设计,使其更适合用于商业项目、系列内容或需要多人协作的创作场景。
平台首页公开了非常多优秀视频的创作过程,如图9-22所示,读者可以跟随着创作者的思路,去看看这些作品的主要创作过程。
TapNow的整体生成效果很不错,下面总结几个实用的功能场景。
(1)支持连续性创作流程,从角色设计到分镜规划,再到场景视频生成,整体流程衔接顺畅,适合中长视频内容的制作需求,如图9-23所示。
(2)平台提供分组功能、首尾帧设置功能,并支持一次性提示词描述多次生成,有助于在同一分镜下对不同生成结果进行对比和筛选,如图9-24所示。
(3)内置“一键拉片”“分镜策划”等专属模板功能,能够在一定程度上降低复杂视频项目的前期规划成本,如图9-25所示。
(4)支持将图片或视频节点直接拖入对话框,系统可基于节点内容生成或补全提示词。这种方式相当于为对话式创作引入上下文,有助于在复杂项目中保持内容的一致性,如图9-26所示。
TapNow的劣势是当项目内容较长时,整体查看项目内容和快速定位仍存在一定不便。不过从当前主流使用场景来看,大多数创作者并不会频繁制作极长篇幅的内容,因此该问题在现阶段对实际创作影响相对有限。
🔎5.Mulan
Mulan是一款以对话驱动为核心的AI内容创作平台,其突出特点在于能够通过自然语言交互,自动生成可视化的工作流结构。创作者无须手动搭建复杂节点,即可在对话过程中逐步形成完整的创作流程,整体逻辑清晰,操作路径直观。
相较于以节点配置为主的传统工具,Mulan将工作流构建前置为系统能力,使创作者能够更专注于内容本身,而非工具参数的组合与调试,其工作过程如图9-27所示。
从实际使用场景来看,Mulan更适合以下几类用户。
- 在使用ComfyUI、n8n、扣子等流程型工具进行AI图像或视频创作时存在一定学习成本,希望通过更简化方式完成内容生成的用户。
- 需要批量生成风格统一、质量稳定的视频内容,例如,用于TikTok电商、企业社交媒体营销矩阵等场景的创作者或团队。
- 从事品牌营销、教育培训、AI短剧及AI短视频等需要持续输出内容的机构或个人。
- 有明确宣传需求,但预算有限,希望通过AI工具降低视频制作成本的小微企业主。
- 具有其他非标准化需求的长尾创作场景用户。
从产品定位来看,Mulan当前更偏向于通用型AI内容创作平台,而非专门面向AI漫剧的垂直Agent。其优势在于覆盖场景较广泛,能够满足多种类型内容的生成需求。
在功能层面,Mulan已具备与TapNow相近的核心能力,同时通过对话方式生成工作流,使其在使用门槛上明显低于ComfyUI、n8n、扣子等偏工程化的工具;相较于TapNow等流程较为固定的平台,Mulan在创作自由度上也更具灵活性。
总体而言,Mulan更适合作为一款低门槛、强扩展的通用创作工具,服务于对流程可控性和创作效率均有要求的用户群体。