MiMo TTS

MiMo 在 Neiroha 中走 OpenAI Chat Completions TTS 适配器。这个适配器不是 /v1/audio/speech，而是调用 /v1/chat/completions，并从返回的 message.audio.data 里取 base64 音频。

准备接口密钥

打开 Xiaomi MiMo 或 MiMo 开放平台控制台。
登录账号。
在控制台查看 Token Plan、credit、模型可用性和接口密钥。
创建一个供 Neiroha 使用的 key，便于独立查看用量。

MiMo 的套餐、赠送额度和限时免费活动会变化。免费额度不应视为永久额度；实际可用额度以控制台为准。

提供商填写

字段	推荐值
Adapter Type	`OpenAI Chat Completions TTS`
Name	`Xiaomi MiMo` 或 `MiMo Trial`
基础地址（Base URL）	`https://api.xiaomimimo.com/v1`
接口密钥（API Key）	MiMo 控制台创建的 key
默认模型（Default Model）	`mimo-v2-tts`，或控制台可用的 TTS / VoiceDesign / VoiceClone 模型

保存后：

点 拉取全部（Fetch All）。
如果模型列表能拉取，选择需要使用的 TTS 模型。
如果模型列表为空，但模型名确认正确，可以手动填模型名。
打开启用开关。
点 健康检查（Health Check）。

角色创建方式

模型类型	角色模式	必填内容
普通 TTS	预设音色	选择或填写预设音色
VoiceDesign	音色设计	在声音指令里写声音风格
VoiceClone	音色克隆	上传 mp3 / wav 参考音频

Neiroha 内置的 MiMo 音色候选会按模型名判断。普通 mimo-v2-tts 会提供 mimo_default、default_zh、default_en；v2.5 普通 TTS 模型会提供 mimo_default、冰糖、茉莉、苏打、白桦、Mia、Chloe、Milo、Dean。控制台文档更新后，以实际模型返回和官方说明为准。

声音设计写法

VoiceDesign 类模型没有固定预设音色。角色里把任务模式切到声音设计，然后在 instruction 填写声音要求：

年轻女性，中文普通话，语速略慢，音色干净，适合旁白。

生成时，Neiroha 会把 instruction 放到 user message，正文放到 assistant message。

VoiceClone 注意点

参考音频支持 mp3 或 wav。
单个参考音频建议短而干净，避免背景音乐和混响。
Neiroha 会把参考音频编码成 data:audio/...;base64,... 再发给模型。
当前适配器对参考音频大小有保护，过大的文件会被拒绝。

限流和成本

MiMo 适合测试中文声音，但批量项目仍建议设置提供商限流：

字段	建议
最大并发	从 `1` 开始
RPD	按试用额度或每日预算设置
TPM / TPD	按 Token Plan 或模型计费规则设置

对话 TTS、段落 TTS、小说阅读器、视频配音都会消耗同一个 key 的额度。长文本应先用短样本确认风格，再批量生成。

准备接口密钥​

提供商填写​

角色创建方式​

声音设计写法​

VoiceClone 注意点​

限流和成本​