用 AI Agent 自动生成科普动画:Remotion + Skills 实操教程
方案概述
Remotion 是一个基于 React 的编程式视频创作框架 — 用写代码的方式做视频。配合 AI Agent(Tree Solo)的 Skills/MCP 技术,可以实现从 PDF 教材解析、知识点提取、动画脚本编写到最终渲染输出的全自动流程。
技术栈
| 组件 | 说明 |
|---|---|
| Remotion | 基于 React 的视频框架,视频即代码 |
| Tree (Solo) | AI Agent,负责任务调度与代码生成 |
| Skills/MCP | Agent 的技能扩展协议 |
| 火山引擎 TTS | 文字转语音,通过自定义 Skill 调用 |
配置 Skills
第一步是在 Tree 中导入技能包。Skills 赋予 AI Agent 调用外部工具的能力 — 检索文档、下载素材、编写代码、渲染视频,都可以作为独立的 Skill 注册。

连接 GitHub MCP
通过 MCP 协议连接 GitHub,Agent 可以直接拉取 Remotion 模板项目,并在此基础上修改代码生成动画。需要配置 GitHub Token 作为认证凭证。

环境变量配置是整个搭建过程中最容易出错的环节,需要正确设置 Token、API Key 等参数。
工作流程
整个流程由提示词驱动:
- 告诉 Agent 目标(比如「把这道圆锥摆的例题做成科普动画」)
- Agent 自动解析 PDF,提取知识点
- 编写 Remotion React 组件代码
- 调用 TTS 生成配音
- 渲染输出最终视频

最终效果
AI 生成的动画包含受力分析图示、运动轨迹演示和配音讲解。虽然不如专业动画精致,但作为教学辅助内容完全够用。

当前局限
AI 绘图能力有限。 SVG 矢量图生成质量不稳定,画复杂物体(比如动物)会很抽象,需要人工替换素材。
需要多轮修正。 初版动画常有逻辑错误,比如受力方向画反、动画卡住,需要通过调整提示词反复修正。
技术门槛明显。 涉及环境变量配置、GitHub Token、Python 脚本,没有编程基础基本玩不转。
生态尚在早期。 部分专业 Skill(如特定的 TTS 接入)需要自行开发,开源社区还在成长阶段。
适合什么人
有编程基础的科普视频创作者和教育从业者,希望用 AI 自动化批量生产教学内容。如果你依赖 Premiere 或 After Effects 做精细剪辑,或者完全没有编程经验,目前还不适合入手。
相关文章:千问 3.5 实测 覆盖了更多 AI Agent 的能力评估;Codex 编程工具测评 对比了不同 AI 编程工具的实际效果。