跳到主要内容

配置提供商

提供商是 Neiroha 连接外部 TTS 后端的入口。它保存服务访问方式;项目实际使用的声音需要在 语音角色与语音库 中绑定。

提供商配置页

核心关系

层级在 Neiroha 里的位置作用
提供商提供商(Providers) 页面保存基础地址(Base URL)、接口密钥(API Key)、适配器类型、并发和限流
模型 / 音色缓存提供商详情面板从后端拉取可用模型和音色,供角色创建时选择
语音角色语音库(Voice Bank) 页面把一个提供商、模型、音色、语速、参考音频或声音描述绑定成“角色”
语音库语音库(Voice Bank) 页面把多个角色组成一套音色库,供对话、段落、小说、视频和 API 使用

适配器类型

适配器适用场景
OpenAI TTS API 兼容OpenAI、KoboldCpp、Kokoro/XTTS、Orpheus 等实现 OpenAI TTS 协议的服务
Azure 语音服务Microsoft Azure Speech TTS
GPT-SoVITS本地 GPT-SoVITS 服务器
CosyVoice 原生本地 CosyVoice 推理服务器
VoxCPM2 原生本地 VoxCPM2 推理服务器
OpenAI Chat Completions TTS通过 Chat Completions 返回音频的模型,例如 MiMo v2 TTS
Google Gemini TTSGoogle AI Studio Gemini TTS 模型
Windows 系统语音Windows SAPI 语音,无需外部服务器

创建提供商

  1. 打开左侧导航的 提供商(Providers)
  2. 点击左侧提供商列表右上角的 +
  3. 选择适配器类型。本地模型接入见 连接本地推理引擎;云端免费额度或试用额度接入见 连接云端推理引擎
  4. 填名称。建议用 平台 + 用途,例如 MiMo Free TrialCosyVoice Local 9880Azure East US
  5. 填基础地址(Base URL)和接口密钥(API Key)。
  6. 保存后回到提供商详情面板,先点 拉取全部(Fetch All),再打开启用开关。
  7. 健康检查(Health Check)。通过后再去创建语音角色。

基础地址填写规则

场景示例注意点
本机桌面连接本机服务http://127.0.0.1:8880/v1OpenAI 兼容服务通常带 /v1
本机桌面连接局域网服务http://192.168.1.20:9880确认防火墙放行端口
Android 模拟器连接宿主机http://10.0.2.2:9880模拟器里的 127.0.0.1 是模拟器自身
Android 真机连接电脑http://电脑局域网地址:9880手机和电脑要在同一网络,或使用可访问的内网穿透
Azureeastushttps://eastus.tts.speech.microsoft.comNeiroha 会把区域名规范化为 TTS endpoint
Geminihttps://generativelanguage.googleapis.com使用 Google AI Studio API key
MiMohttps://api.xiaomimimo.com/v1使用 api-key 头,不是 Bearer 头

接口密钥和鉴权

适配器Key 是否必需Neiroha 使用的鉴权方式
OpenAI TTS API 兼容看服务端设置Authorization: Bearer <key>
OpenAI Chat Completions TTS云端通常必需默认 api-key: <key>,适配 MiMo 风格
Google Gemini TTS必需x-goog-api-key: <key>
Azure Speech Service必需Ocp-Apim-Subscription-Key: <key>
GPT-SoVITS / CosyVoice / VoxCPM2 本地通常可留空本地服务启用鉴权时再填写 key
Windows 系统语音不需要本机 SAPI

拉取全部后检查项

拉取全部(Fetch All) 后,右侧会缓存后端返回的模型和音色。这里决定了后面创建角色时下拉框有没有内容。

看到的情况含义处理
模型和音色都有配置完整打开启用开关,进入语音库
只有模型,没有音色后端没有音色列表接口,或模型属于声音设计类创建角色时手动填写 voice / instruction
只有音色,没有模型Azure / 系统语音类后端常见正常,角色里选 voice 即可
全空但健康检查通过服务可达,但列表接口不兼容手动填默认模型和音色,再做快速测试
健康检查失败URL、key、端口、网络或区域不正确先用浏览器 / curl 验证后端,再修改提供商

并发与额度分开配置

提供商的并发、RPM、TPM、RPD 限流会作用到所有工作流:快速 TTS、对话 TTS、段落 TTS、小说阅读器、视频配音和本地 API 服务器都共用同一个 TtsQueueService

推荐设置:

后端推荐设置
本地 GPU 服务先把最大并发设为 1,确认显存稳定后再增加
Gemini 免费档按官方 Rate Limits 设置 RPM / TPM / RPD,避免连续批量生成触发 429
Azure F0主要按字符额度和并发限制控制,长文本先用段落 TTS 小批量验证
MiMo / 其他 Token Plan以控制台余额和速率限制为准,给提供商设置保守 RPD / TPM

下一步