Skip to content

文本转语音

文本转语音接口用于把文本转换为音频,适合语音播报、配音、内容朗读和语音助手输出。

接口路径

方法路径返回方式
POST/v1/audio/speech同步返回音频内容或音频响应。

请求示例

bash
curl https://moonapix.com/v1/audio/speech \
  -H "Authorization: Bearer <MOONAPIX_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to MoonApiX.",
    "voice": "alloy",
    "response_format": "mp3"
  }'

常用字段

字段说明
model语音模型名,例如 tts-1
input需要朗读的文本。
voice音色名。
response_format输出格式,例如 mp3
speed语速设置,以 API Reference 为准。

响应处理

场景处理方式
直接播放将响应音频写入播放器或临时文件。
复用音频保存音频文件、原始文本、音色和模型名。
长文本按自然段生成多个音频片段,再在业务侧组合。

接入建议

  • 面向用户播放时建议保存音频文件地址和对应文本,方便重复使用。
  • 长文本请拆成自然段,避免一次请求承载过多内容。
  • 如果需要字幕同步,请在业务侧保存文本片段与音频片段的对应关系。

相关页面