提供商是 Neiroha 连接外部 TTS 后端的入口。它保存服务访问方式;项目实际使用的声音需要在 语音角色与语音库 中绑定。
核心关系
| 层级 | 在 Neiroha 里的位置 | 作用 |
|---|
| 提供商 | 提供商(Providers) 页面 | 保存基础地址(Base URL)、接口密钥(API Key)、适配器类型、并发和限流 |
| 模型 / 音色缓存 | 提供商详情面板 | 从后端拉取可用模型和音色,供角色创建时选择 |
| 语音角色 | 语音库(Voice Bank) 页面 | 把一个提供商、模型、音色、语速、参考音频或声音描述绑定成“角色” |
| 语音库 | 语音库(Voice Bank) 页面 | 把多个角色组成一套音色库,供对话、段落、小说、视频和 API 使用 |
适配器类型
| 适配器 | 适用场景 |
|---|
| OpenAI TTS API 兼容 | OpenAI、KoboldCpp、Kokoro/XTTS、Orpheus 等实现 OpenAI TTS 协议的服务 |
| Azure 语音服务 | Microsoft Azure Speech TTS |
| GPT-SoVITS | 本地 GPT-SoVITS 服务器 |
| CosyVoice 原生 | 本地 CosyVoice 推理服务器 |
| VoxCPM2 原生 | 本地 VoxCPM2 推理服务器 |
| OpenAI Chat Completions TTS | 通过 Chat Completions 返回音频的模型,例如 MiMo v2 TTS |
| Google Gemini TTS | Google AI Studio Gemini TTS 模型 |
| Windows 系统语音 | Windows SAPI 语音,无需外部服务器 |
创建提供商
- 打开左侧导航的 提供商(Providers)。
- 点击左侧提供商列表右上角的 +。
- 选择适配器类型。本地模型接入见 连接本地推理引擎;云端免费额度或试用额度接入见 连接云端推理引擎。
- 填名称。建议用
平台 + 用途,例如 MiMo Free Trial、CosyVoice Local 9880、Azure East US。
- 填基础地址(
Base URL)和接口密钥(API Key)。
- 保存后回到提供商详情面板,先点 拉取全部(Fetch All),再打开启用开关。
- 点 健康检查(Health Check)。通过后再去创建语音角色。
基础地址填写规则
| 场景 | 示例 | 注意点 |
|---|
| 本机桌面连接本机服务 | http://127.0.0.1:8880/v1 | OpenAI 兼容服务通常带 /v1 |
| 本机桌面连接局域网服务 | http://192.168.1.20:9880 | 确认防火墙放行端口 |
| Android 模拟器连接宿主机 | http://10.0.2.2:9880 | 模拟器里的 127.0.0.1 是模拟器自身 |
| Android 真机连接电脑 | http://电脑局域网地址:9880 | 手机和电脑要在同一网络,或使用可访问的内网穿透 |
| Azure | eastus 或 https://eastus.tts.speech.microsoft.com | Neiroha 会把区域名规范化为 TTS endpoint |
| Gemini | https://generativelanguage.googleapis.com | 使用 Google AI Studio API key |
| MiMo | https://api.xiaomimimo.com/v1 | 使用 api-key 头,不是 Bearer 头 |
接口密钥和鉴权
| 适配器 | Key 是否必需 | Neiroha 使用的鉴权方式 |
|---|
| OpenAI TTS API 兼容 | 看服务端设置 | Authorization: Bearer <key> |
| OpenAI Chat Completions TTS | 云端通常必需 | 默认 api-key: <key>,适配 MiMo 风格 |
| Google Gemini TTS | 必需 | x-goog-api-key: <key> |
| Azure Speech Service | 必需 | Ocp-Apim-Subscription-Key: <key> |
| GPT-SoVITS / CosyVoice / VoxCPM2 本地 | 通常可留空 | 本地服务启用鉴权时再填写 key |
| Windows 系统语音 | 不需要 | 本机 SAPI |
拉取全部后检查项
点 拉取全部(Fetch All) 后,右侧会缓存后端返回的模型和音色。这里决定了后面创建角色时下拉框有没有内容。
| 看到的情况 | 含义 | 处理 |
|---|
| 模型和音色都有 | 配置完整 | 打开启用开关,进入语音库 |
| 只有模型,没有音色 | 后端没有音色列表接口,或模型属于声音设计类 | 创建角色时手动填写 voice / instruction |
| 只有音色,没有模型 | Azure / 系统语音类后端常见 | 正常,角色里选 voice 即可 |
| 全空但健康检查通过 | 服务可达,但列表接口不兼容 | 手动填默认模型和音色,再做快速测试 |
| 健康检查失败 | URL、key、端口、网络或区域不正确 | 先用浏览器 / curl 验证后端,再修改提供商 |
并发与额度分开配置