Skip to content

音频转录和翻译

音频转录用于把音频转换为文本;音频翻译用于把音频内容翻译为目标语言。两类接口都使用 multipart 表单上传音频文件。

接口路径

方法路径用途
POST/v1/audio/transcriptions音频转录。
POST/v1/audio/translations音频翻译。

音频转录

http
POST /v1/audio/transcriptions
bash
curl https://moonapix.com/v1/audio/transcriptions \
  -H "Authorization: Bearer <MOONAPIX_API_KEY>" \
  -F "file=@./speech.mp3" \
  -F "model=whisper-1"

音频翻译

http
POST /v1/audio/translations
bash
curl https://moonapix.com/v1/audio/translations \
  -H "Authorization: Bearer <MOONAPIX_API_KEY>" \
  -F "file=@./speech.mp3" \
  -F "model=whisper-1"

常用字段

字段说明
file音频文件。
model转录或翻译模型名。
language输入语言提示,以 API Reference 为准。
response_format返回格式,例如 jsontext

响应处理

场景处理方式
普通文本保存转录文本、文件名和模型名。
字幕场景保存分段文本和时间信息,以返回格式为准。
长音频切片处理后按业务 ID 合并文本。

接入建议

  • 上传前确认音频清晰,尽量减少背景噪声。
  • 长音频建议先切片,再按业务 ID 合并结果。
  • 需要字幕时保存分段文本、时间信息和原始文件名。

相关页面