Skip to content

Responses

Responses 适合使用 Responses 格式的文本生成、多模态输入和工具调用风格接入。已有 OpenAI-compatible SDK 时,可以继续使用统一 Base URL 与 Bearer 鉴权。

接口路径

方法路径返回方式
POST/v1/responses同步 JSON 或 SSE 流式返回。
POST/v1/responses/compact对长对话上下文做压缩,返回压缩后的 Responses 结果。

请求示例

bash
curl https://moonapix.com/v1/responses \
  -H "Authorization: Bearer <MOONAPIX_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "moonapix-chat",
    "input": "请把这句话改写得更适合开发者文档:接入以后就可以用了。"
  }'

常用字段

字段说明
model模型名。
input文本或结构化输入。
instructions对输出目标和风格的补充约束。
max_output_tokens限制输出长度。
stream设置为 true 时使用流式返回。

上下文压缩

长对话需要压缩上下文时,可以调用 POST /v1/responses/compact。该接口适合在客户端或服务端保留关键上下文、减少后续请求长度。

bash
curl https://moonapix.com/v1/responses/compact \
  -H "Authorization: Bearer <MOONAPIX_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "moonapix-chat-openai-compact",
    "input": "请压缩目前对话,保留用户目标、关键约束和下一步动作。"
  }'
字段说明
model支持上下文压缩的模型名。
input需要压缩的文本或消息数组。
instructions可选。指定压缩风格、保留重点或输出格式。
previous_response_id可选。继续已有 Responses 流程时传入。

适用场景

场景建议
新接入 Responses 格式使用 /v1/responses
长对话压缩使用 /v1/responses/compact
传统聊天客户端使用 Chat Completions
Claude 兼容客户端使用 Messages

响应处理

场景处理方式
普通返回从响应对象中读取最终输出文本。
流式返回按 SSE 事件合并增量内容。
多模态输入保存输入素材 URL、请求体和最终输出,便于复盘。

相关页面