Appearance
网页阅读
网页阅读接口用于提取指定网页正文。适合把网页内容转换为 Markdown、文本或 JSON,再交给文本模型做摘要、分析和问答。
方法与路径
http
POST /v1/web-reader/read请求示例
bash
curl https://moonapix.com/v1/web-reader/read \
-H "Authorization: Bearer <MOONAPIX_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"url": "https://example.com/article",
"format": "md",
"liteMode": true,
"includeImages": true
}'常用字段
| 字段 | 类型 | 说明 |
|---|---|---|
url | string | 要读取的网页 URL。 |
format | string | 返回格式。 |
liteMode | boolean | 是否启用精简模式。 |
includeImages | boolean | 是否包含图片。 |
onlyCSSSelectors | string[] | 可选。只读取匹配选择器的内容。 |
waitForCSSSelectors | string[] | 可选。等待指定元素出现后再读取。 |
使用建议
- 搜索接口用于发现页面,阅读接口用于读取指定页面正文。
- 对同一网页做多次处理时,建议缓存阅读结果。
- 读取结果较长时,可以先摘要再进入后续模型调用。