Skip to content

网页阅读

网页阅读接口用于提取指定网页正文。适合把网页内容转换为 Markdown、文本或 JSON,再交给文本模型做摘要、分析和问答。

方法与路径

http
POST /v1/web-reader/read

请求示例

bash
curl https://moonapix.com/v1/web-reader/read \
  -H "Authorization: Bearer <MOONAPIX_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "url": "https://example.com/article",
    "format": "md",
    "liteMode": true,
    "includeImages": true
  }'

常用字段

字段类型说明
urlstring要读取的网页 URL。
formatstring返回格式。
liteModeboolean是否启用精简模式。
includeImagesboolean是否包含图片。
onlyCSSSelectorsstring[]可选。只读取匹配选择器的内容。
waitForCSSSelectorsstring[]可选。等待指定元素出现后再读取。

使用建议

  • 搜索接口用于发现页面,阅读接口用于读取指定页面正文。
  • 对同一网页做多次处理时,建议缓存阅读结果。
  • 读取结果较长时,可以先摘要再进入后续模型调用。

相关页面