跳到主要内容

配置提供商

提供商是 Neiroha 连接外部 TTS 后端的入口。它保存服务访问方式；项目实际使用的声音需要在语音角色与语音库中绑定。

提供商配置页

核心关系

层级	在 Neiroha 里的位置	作用
提供商	提供商（Providers）页面	保存基础地址（Base URL）、接口密钥（API Key）、适配器类型、并发和限流
模型 / 音色缓存	提供商详情面板	从后端拉取可用模型和音色，供角色创建时选择
语音角色	语音库（Voice Bank）页面	把一个提供商、模型、音色、语速、参考音频或声音描述绑定成“角色”
语音库	语音库（Voice Bank）页面	把多个角色组成一套音色库，供对话、段落、小说、视频和 API 使用

适配器类型

适配器	适用场景
OpenAI TTS API 兼容	OpenAI、KoboldCpp、Kokoro/XTTS、Orpheus 等实现 OpenAI TTS 协议的服务
Azure 语音服务	Microsoft Azure Speech TTS
GPT-SoVITS	本地 GPT-SoVITS 服务器
CosyVoice 原生	本地 CosyVoice 推理服务器
VoxCPM2 原生	本地 VoxCPM2 推理服务器
OpenAI Chat Completions TTS	通过 Chat Completions 返回音频的模型，例如 MiMo v2 TTS
Google Gemini TTS	Google AI Studio Gemini TTS 模型
Windows 系统语音	Windows SAPI 语音，无需外部服务器

创建提供商

打开左侧导航的 提供商（Providers）。
点击左侧提供商列表右上角的 +。
选择适配器类型。本地模型接入见连接本地推理引擎；云端免费额度或试用额度接入见连接云端推理引擎。
填名称。建议用 平台 + 用途，例如 MiMo Free Trial、CosyVoice Local 9880、Azure East US。
填基础地址（Base URL）和接口密钥（API Key）。
保存后回到提供商详情面板，先点 拉取全部（Fetch All），再打开启用开关。
点 健康检查（Health Check）。通过后再去创建语音角色。

基础地址填写规则

场景	示例	注意点
本机桌面连接本机服务	`http://127.0.0.1:8880/v1`	OpenAI 兼容服务通常带 `/v1`
本机桌面连接局域网服务	`http://192.168.1.20:9880`	确认防火墙放行端口
Android 模拟器连接宿主机	`http://10.0.2.2:9880`	模拟器里的 `127.0.0.1` 是模拟器自身
Android 真机连接电脑	`http://电脑局域网地址:9880`	手机和电脑要在同一网络，或使用可访问的内网穿透
Azure	`eastus` 或 `https://eastus.tts.speech.microsoft.com`	Neiroha 会把区域名规范化为 TTS endpoint
Gemini	`https://generativelanguage.googleapis.com`	使用 Google AI Studio API key
MiMo	`https://api.xiaomimimo.com/v1`	使用 `api-key` 头，不是 Bearer 头

接口密钥和鉴权

适配器	Key 是否必需	Neiroha 使用的鉴权方式
OpenAI TTS API 兼容	看服务端设置	`Authorization: Bearer <key>`
OpenAI Chat Completions TTS	云端通常必需	默认 `api-key: <key>`，适配 MiMo 风格
Google Gemini TTS	必需	`x-goog-api-key: <key>`
Azure Speech Service	必需	`Ocp-Apim-Subscription-Key: <key>`
GPT-SoVITS / CosyVoice / VoxCPM2 本地	通常可留空	本地服务启用鉴权时再填写 key
Windows 系统语音	不需要	本机 SAPI

拉取全部后检查项

点 拉取全部（Fetch All） 后，右侧会缓存后端返回的模型和音色。这里决定了后面创建角色时下拉框有没有内容。

看到的情况	含义	处理
模型和音色都有	配置完整	打开启用开关，进入语音库
只有模型，没有音色	后端没有音色列表接口，或模型属于声音设计类	创建角色时手动填写 voice / instruction
只有音色，没有模型	Azure / 系统语音类后端常见	正常，角色里选 voice 即可
全空但健康检查通过	服务可达，但列表接口不兼容	手动填默认模型和音色，再做快速测试
健康检查失败	URL、key、端口、网络或区域不正确	先用浏览器 / curl 验证后端，再修改提供商

并发与额度分开配置

提供商的并发、RPM、TPM、RPD 限流会作用到所有工作流：快速 TTS、对话 TTS、段落 TTS、小说阅读器、视频配音和本地 API 服务器都共用同一个 TtsQueueService。

推荐设置：

后端	推荐设置
本地 GPU 服务	先把最大并发设为 `1`，确认显存稳定后再增加
Gemini 免费档	按官方 Rate Limits 设置 RPM / TPM / RPD，避免连续批量生成触发 429
Azure F0	主要按字符额度和并发限制控制，长文本先用段落 TTS 小批量验证
MiMo / 其他 Token Plan	以控制台余额和速率限制为准，给提供商设置保守 RPD / TPM

下一步

本地服务、局域网服务、Android 模拟器连接电脑：看连接本地推理引擎。
本地 GPT-SoVITS：看 Neiroha GPT-SoVITS。
本地 VoxCPM2：看 Neiroha VoxCPM2。
本地 CosyVoice3：看 Neiroha CosyVoice3。
云端服务和免费额度：看连接云端推理引擎。
MiMo：看 MiMo TTS。
Gemini：看 Gemini TTS。
Azure：看 Azure Speech。
提供商通过后，继续创建语音角色与语音库。

核心关系
适配器类型
创建提供商
基础地址填写规则
接口密钥和鉴权
拉取全部后检查项
并发与额度分开配置
下一步