
@modelcontextprotocol/web-content-pick

2025.03.05
1
TypeScript网页内容提取数据抓取搜索工具
mcp-web-content-pick 是一个强大的工具,用于从网页中提取结构化内容。它是 Model Context Protocol 工具包的一部分,支持自定义选择器和爬取选项,能够高效地处理网页内容并生成清晰的层次化输出。
View on GitHub
Overview
基本能力
产品定位
mcp-web-content-pick 是一个用于从网页中提取结构化内容的工具,适用于需要自动化抓取和处理网页数据的场景。
核心功能
- 🌐 从任何网页提取结构化内容
- 🎯 可自定义 CSS 选择器以定位特定内容
- 🌲 支持递归爬取,并可控制爬取深度
- 🔄 自动重试机制
- ⚡ 快速高效的处理能力
- 📝 生成清晰、层次化的输出格式
适用场景
- 网页数据抓取与分析
- 内容聚合与整理
- 自动化测试与监控
- 数据挖掘与研究
工具列表
mcp-web-content-pick
: 主工具,用于提取网页内容
常见问题解答
无具体常见问题解答信息。
使用教程
使用依赖
需要安装 Node.js 和 npm。
安装教程
- 安装工具:
npm install -g mcp-web-content-pick
- 在
claude_desktop_config.json
中添加配置:
{
"mcpServers": {
"web_content_search": {
"command": "npx",
"args": [
"-y",
"mcp-web-content-pick"
]
}
}
}
调试方式
无具体调试命令信息。
许可证
None