Appearance
Chat Completions
Chat Completions 是文本系列中最常用的对话入口,适合聊天客户端、助手、工作流节点和需要流式输出的文本生成场景。
接口路径
| 方法 | 路径 | 返回方式 |
|---|---|---|
POST | /v1/chat/completions | 同步 JSON 或 SSE 流式返回。 |
请求示例
bash
curl https://moonapix.com/v1/chat/completions \
-H "Authorization: Bearer <MOONAPIX_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "moonapix-chat",
"messages": [
{
"role": "system",
"content": "你是一个简洁的开发者助手。"
},
{
"role": "user",
"content": "写一句 API 接入成功后的欢迎语。"
}
]
}'常用字段
| 字段 | 说明 |
|---|---|
model | 模型名。先通过 模型查询 确认可用模型。 |
messages | 多轮对话消息数组。 |
temperature | 控制输出随机性。 |
max_tokens | 限制生成长度。 |
stream | 设置为 true 时使用 SSE 流式返回。 |
消息结构
| role | 用途 |
|---|---|
system | 设置角色、语气和边界。 |
user | 用户输入。 |
assistant | 历史助手回复。 |
响应处理
| 场景 | 处理方式 |
|---|---|
| 普通返回 | 读取响应中的生成文本,并保存请求模型和 trace 信息。 |
| 流式返回 | 按 SSE 事件逐段追加内容,结束事件到达后关闭连接。 |
| 请求失败 | 检查模型名、API Key 权限、请求体格式和上下文长度。 |
接入建议
- 聊天客户端优先使用这个接口,Base URL 设置为
https://moonapix.com/v1。 - 多轮对话请只传必要上下文,避免把无关历史放进请求。
- 需要边生成边展示时设置
stream: true,并按 SSE 事件处理增量内容。