Data MCP Server

Data MCP Server

site icon
2025.04.24 0
TypeScript网页抓取结构化数据提取浏览器代理浏览器自动化开发效率
Data MCP Server 是一个基于 Model Context Protocol (MCP) 的服务,主要用于网页抓取、结构化数据提取和网页爬取。它还提供了对通用浏览器代理(如 OpenAI 的 CUA、Anthropic 的 Claude Computer Use 和 Browser Use)的便捷访问。该服务适用于需要自动化网页操作、数据提取和浏览器代理集成的场景。
View on GitHub

Overview

基本能力

产品定位

Data MCP Server 是一个用于网页抓取、结构化数据提取和浏览器代理集成的服务。

核心功能

  • 网页抓取:提取格式化内容(如 Markdown、截图等)。
  • 网页爬取:通过多个链接页面导航并提取适合 LLM 的格式化内容。
  • 结构化数据提取:将混乱的 HTML 转换为结构化的 JSON。
  • 搜索功能:使用 Bing 搜索查询网络并获取结果。
  • 浏览器代理:支持多种浏览器代理,包括 Browser Use 代理、OpenAI 的 CUA 模型和 Claude Computer Use。
  • 配置文件管理:创建、删除和列出持久性 Data 配置文件。

适用场景

  • 自动化网页数据提取和爬取。
  • 浏览器自动化任务。
  • 结构化数据转换和处理。
  • 集成多种浏览器代理进行复杂任务。

工具列表

  • scrape_webpage:从任何网页提取格式化内容。
  • crawl_webpages:通过多个链接页面导航并提取内容。
  • extract_structured_data:将 HTML 转换为结构化 JSON。
  • search_with_bing:使用 Bing 搜索查询网络。
  • browser_use_agent:轻量级浏览器自动化。
  • openai_computer_use_agent:使用 OpenAI 的 CUA 模型进行通用自动化。
  • claude_computer_use_agent:使用 Claude Computer Use 进行复杂浏览器任务。
  • create_profile:创建新的持久性 Data 配置文件。
  • delete_profile:删除现有的持久性 Data 配置文件。
  • list_profiles:列出现有的持久性 Data 配置文件。

常见问题解答

  • 如何安装 Data MCP Server?
  • 可以通过 npx data-mcp <YOUR-DATA-API-KEY> 安装。
  • 如何配置 Cursor 或 Windsurf?
  • ~/.cursor/mcp.json./codeium/windsurf/model_config.json 中添加相应的配置。
  • 如何开发?
  • 克隆仓库、安装依赖、构建并运行 node dist/server.js

使用教程

使用依赖

  • 需要安装 Node.js 和 npm/yarn。

安装教程

  1. 手动安装: bash npx data-mcp <YOUR-DATA-API-KEY>
  2. 开发安装: sh git clone [email protected]:NexusX-MCP/data-mcp-server.git data-mcp cd data-mcp npm install npm run build node dist/server.js
  3. 通过 Smithery 安装: bash npx -y @smithery/cli install @data-mcp --client claude

调试方式

  • 运行服务器后,可以通过客户端工具(如 Claude Desktop)进行调试。
  • 检查日志和配置文件是否正确。

许可证

该项目遵循 ISC 开源许可条款,请参阅 ISC 了解完整条款。