视频配音模块面向“字幕 → TTS → 导出配音”的单视频工作流。它不是完整剪辑软件,但覆盖常见配音制作路径。
适合什么任务
| 任务 | 适合度 |
|---|
| 给短视频字幕生成配音 | 适合 |
| 给已有 SRT / LRC 批量配音 | 适合 |
| 精细剪辑、多轨混音、复杂转场 | 需要交给专业剪辑软件 |
| Android 本机导出视频 | 当前不支持本地 FFmpeg 导出 |
基础流程
- 创建项目并选择语音库。
- 导入视频到 V1,原视频音频会作为 A1 关联轨道。
- 导入 SRT 或 LRC 字幕。
- 为字幕 cue 生成 TTS。
- 在轻量时间轴上移动字幕和导入音频。
- 必要时使用同步长度工具,让生成 语音贴合字幕时间窗。
- 使用 设置 → 媒体工具(Media Tools) 中配置的 FFmpeg 默认值导出音频或配音视频。
字幕导入建议
| 字幕情况 | 建议 |
|---|
| 每条字幕已经是最终台词 | 导入后直接分配音色 |
| 字幕太长 | 导入前在字幕编辑器拆短,或导入后逐条编辑 |
| 多角色字幕 | 导入后逐 cue 分配角色 |
| 时间轴需要贴合口型 | 先生成短句,再用同步长度工具调整 |
生成前检查
| 检查项 | 原因 |
|---|
| 项目绑定的语音库 | cue 的音色下拉框来自这个库 |
| FFmpeg 路径 | Windows / Linux 导出需要外部 FFmpeg |
| 提供商限流 | 字幕多时会产生大量 TTS 请求 |
| A1 静音开关 | 决定导出时是否保留原视频音频 |
平台限制
视频配音依赖本地 FFmpeg 能力:
| 能力 | Windows | Linux | Android |
|---|
| 外部 FFmpeg 命令行路径 / PATH 检测 | ✓ | ✓ | - |
| 本地波形提取、裁剪、混音导出 | ✓ | ✓ | - |
Android 端保留 UI 与 TTS 客户端工作流,但本地 FFmpeg 混流、裁剪、波形提取和视频导出不可用。
推荐制作顺序
- 先导入视频和字幕。
- 只选前 3 条 cue 生成 TTS。
- 播放预览,确认音色、语速、字幕窗口和原声静音策略。
- 批量生成剩余 cue。
- 导出音频,先在剪辑软件里检查。
- 确认无误后再导出配音视频。
使用限制
| 限制 | 处理方式 |
|---|
| 复杂剪辑和多轨混音 | 在 Neiroha 生成配音音频后,交给专业剪辑软件完成 |
| 字幕时间重叠 | 导入前先在字幕工具里清理重叠 cue |
| 口型需要高精度 | 按短句生成,必要时用剪辑软件微调音频位置 |
| Android 本机导出 | 当前仅适合 TTS 客户端工作流,视频导出放在桌面端处理 |