@modelcontextprotocol/web-content-pick

@modelcontextprotocol/web-content-pick

site icon
2025.03.05 1
TypeScript网页内容提取数据抓取搜索工具
mcp-web-content-pick 是一个强大的工具,用于从网页中提取结构化内容。它是 Model Context Protocol 工具包的一部分,支持自定义选择器和爬取选项,能够高效地处理网页内容并生成清晰的层次化输出。
View on GitHub

Overview

基本能力

产品定位

mcp-web-content-pick 是一个用于从网页中提取结构化内容的工具,适用于需要自动化抓取和处理网页数据的场景。

核心功能

  • 🌐 从任何网页提取结构化内容
  • 🎯 可自定义 CSS 选择器以定位特定内容
  • 🌲 支持递归爬取,并可控制爬取深度
  • 🔄 自动重试机制
  • ⚡ 快速高效的处理能力
  • 📝 生成清晰、层次化的输出格式

适用场景

  • 网页数据抓取与分析
  • 内容聚合与整理
  • 自动化测试与监控
  • 数据挖掘与研究

工具列表

  • mcp-web-content-pick: 主工具,用于提取网页内容

常见问题解答

无具体常见问题解答信息。

使用教程

使用依赖

需要安装 Node.js 和 npm。

安装教程

  1. 安装工具:
npm install -g mcp-web-content-pick
  1. claude_desktop_config.json 中添加配置:
{
  "mcpServers": {
    "web_content_search": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-web-content-pick"
      ]
    }
  }
}

调试方式

无具体调试命令信息。

许可证

None