Appearance
音频转录和翻译
音频转录用于把音频转换为文本;音频翻译用于把音频内容翻译为目标语言。两类接口都使用 multipart 表单上传音频文件。
接口路径
| 方法 | 路径 | 用途 |
|---|---|---|
POST | /v1/audio/transcriptions | 音频转录。 |
POST | /v1/audio/translations | 音频翻译。 |
音频转录
http
POST /v1/audio/transcriptionsbash
curl https://moonapix.com/v1/audio/transcriptions \
-H "Authorization: Bearer <MOONAPIX_API_KEY>" \
-F "file=@./speech.mp3" \
-F "model=whisper-1"音频翻译
http
POST /v1/audio/translationsbash
curl https://moonapix.com/v1/audio/translations \
-H "Authorization: Bearer <MOONAPIX_API_KEY>" \
-F "file=@./speech.mp3" \
-F "model=whisper-1"常用字段
| 字段 | 说明 |
|---|---|
file | 音频文件。 |
model | 转录或翻译模型名。 |
language | 输入语言提示,以 API Reference 为准。 |
response_format | 返回格式,例如 json 或 text。 |
响应处理
| 场景 | 处理方式 |
|---|---|
| 普通文本 | 保存转录文本、文件名和模型名。 |
| 字幕场景 | 保存分段文本和时间信息,以返回格式为准。 |
| 长音频 | 切片处理后按业务 ID 合并文本。 |
接入建议
- 上传前确认音频清晰,尽量减少背景噪声。
- 长音频建议先切片,再按业务 ID 合并结果。
- 需要字幕时保存分段文本、时间信息和原始文件名。