Appearance
Responses
Responses 适合使用 Responses 格式的文本生成、多模态输入和工具调用风格接入。已有 OpenAI-compatible SDK 时,可以继续使用统一 Base URL 与 Bearer 鉴权。
接口路径
| 方法 | 路径 | 返回方式 |
|---|---|---|
POST | /v1/responses | 同步 JSON 或 SSE 流式返回。 |
POST | /v1/responses/compact | 对长对话上下文做压缩,返回压缩后的 Responses 结果。 |
请求示例
bash
curl https://moonapix.com/v1/responses \
-H "Authorization: Bearer <MOONAPIX_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "moonapix-chat",
"input": "请把这句话改写得更适合开发者文档:接入以后就可以用了。"
}'常用字段
| 字段 | 说明 |
|---|---|
model | 模型名。 |
input | 文本或结构化输入。 |
instructions | 对输出目标和风格的补充约束。 |
max_output_tokens | 限制输出长度。 |
stream | 设置为 true 时使用流式返回。 |
上下文压缩
长对话需要压缩上下文时,可以调用 POST /v1/responses/compact。该接口适合在客户端或服务端保留关键上下文、减少后续请求长度。
bash
curl https://moonapix.com/v1/responses/compact \
-H "Authorization: Bearer <MOONAPIX_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "moonapix-chat-openai-compact",
"input": "请压缩目前对话,保留用户目标、关键约束和下一步动作。"
}'| 字段 | 说明 |
|---|---|
model | 支持上下文压缩的模型名。 |
input | 需要压缩的文本或消息数组。 |
instructions | 可选。指定压缩风格、保留重点或输出格式。 |
previous_response_id | 可选。继续已有 Responses 流程时传入。 |
适用场景
| 场景 | 建议 |
|---|---|
| 新接入 Responses 格式 | 使用 /v1/responses。 |
| 长对话压缩 | 使用 /v1/responses/compact。 |
| 传统聊天客户端 | 使用 Chat Completions。 |
| Claude 兼容客户端 | 使用 Messages。 |
响应处理
| 场景 | 处理方式 |
|---|---|
| 普通返回 | 从响应对象中读取最终输出文本。 |
| 流式返回 | 按 SSE 事件合并增量内容。 |
| 多模态输入 | 保存输入素材 URL、请求体和最终输出,便于复盘。 |