音频转录和翻译

音频转录用于把音频转换为文本；音频翻译用于把音频内容翻译为目标语言。两类接口都使用 multipart 表单上传音频文件。

接口路径

方法	路径	用途
`POST`	`/v1/audio/transcriptions`	音频转录。
`POST`	`/v1/audio/translations`	音频翻译。

音频转录

http

POST /v1/audio/transcriptions

bash

curl https://moonapix.com/v1/audio/transcriptions \
  -H "Authorization: Bearer <MOONAPIX_API_KEY>" \
  -F "file=@./speech.mp3" \
  -F "model=whisper-1"

音频翻译

http

POST /v1/audio/translations

bash

curl https://moonapix.com/v1/audio/translations \
  -H "Authorization: Bearer <MOONAPIX_API_KEY>" \
  -F "file=@./speech.mp3" \
  -F "model=whisper-1"

常用字段

字段	说明
`file`	音频文件。
`model`	转录或翻译模型名。
`language`	输入语言提示，以 API Reference 为准。
`response_format`	返回格式，例如 `json` 或 `text`。

响应处理

场景	处理方式
普通文本	保存转录文本、文件名和模型名。
字幕场景	保存分段文本和时间信息，以返回格式为准。
长音频	切片处理后按业务 ID 合并文本。

接入建议

上传前确认音频清晰，尽量减少背景噪声。
长音频建议先切片，再按业务 ID 合并结果。
需要字幕时保存分段文本、时间信息和原始文件名。

对话协议

向量

音频

模型

Ideogram 图像

Midjourney 任务

Seedance-2 视频

音频转录和翻译

接口路径

音频转录

音频翻译

常用字段

响应处理

接入建议

相关页面

Ideogram 图像

Midjourney 任务

Seedance-2 视频

音频转录和翻译 ​

接口路径 ​

音频转录 ​

音频翻译 ​

常用字段 ​

响应处理 ​

接入建议 ​

相关页面 ​

音频转录和翻译

接口路径

音频转录

音频翻译

常用字段

响应处理

接入建议

相关页面