Appearance
文本转语音
文本转语音接口用于把文本转换为音频,适合语音播报、配音、内容朗读和语音助手输出。
接口路径
| 方法 | 路径 | 返回方式 |
|---|---|---|
POST | /v1/audio/speech | 同步返回音频内容或音频响应。 |
请求示例
bash
curl https://moonapix.com/v1/audio/speech \
-H "Authorization: Bearer <MOONAPIX_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "tts-1",
"input": "Welcome to MoonApiX.",
"voice": "alloy",
"response_format": "mp3"
}'常用字段
| 字段 | 说明 |
|---|---|
model | 语音模型名,例如 tts-1。 |
input | 需要朗读的文本。 |
voice | 音色名。 |
response_format | 输出格式,例如 mp3。 |
speed | 语速设置,以 API Reference 为准。 |
响应处理
| 场景 | 处理方式 |
|---|---|
| 直接播放 | 将响应音频写入播放器或临时文件。 |
| 复用音频 | 保存音频文件、原始文本、音色和模型名。 |
| 长文本 | 按自然段生成多个音频片段,再在业务侧组合。 |
接入建议
- 面向用户播放时建议保存音频文件地址和对应文本,方便重复使用。
- 长文本请拆成自然段,避免一次请求承载过多内容。
- 如果需要字幕同步,请在业务侧保存文本片段与音频片段的对应关系。