Website Info MCP Server

Website Info MCP Server

site icon
2025.03.18 0
Ruby网页内容提取自动化抓取内容生成
mcp_test_booking 是一个基于 Model Context Protocol (MCP) 的服务器,专门用于从网站提取信息。它利用 AgentQL API 提供强大的网页内容抓取和提取功能。该服务适用于需要自动化获取和处理网页内容的场景,如数据分析、内容聚合和信息监控。
View on GitHub

Overview

基本能力

产品定位

mcp_test_booking 是一个专门用于从网站提取信息的 MCP 服务器,适用于需要自动化获取和处理网页内容的场景。

核心功能

  • fetch_website: 抓取整个网站的内容,包括标题、内容、链接和图片。
  • extract_content: 使用 CSS 选择器提取特定内容,支持复杂选择器。
  • 资源访问: 通过 website://info 资源获取网站信息。

适用场景

  • 数据分析
  • 内容聚合
  • 信息监控

工具列表

  • fetch_website: 抓取整个网站的内容。
  • extract_content: 使用 CSS 选择器提取特定内容。

常见问题解答

  • Q: 如何设置 AgentQL API 密钥? A: 通过环境变量 AGENTQL_API_KEY 设置。
  • Q: 服务器默认端口是多少? A: 默认端口为 3000。

使用教程

使用依赖

  1. 安装依赖: bash bundle install
  2. 设置环境变量: bash export AGENTQL_API_KEY=your_api_key

安装教程

  1. 使用 Cursor 安装:
  2. 打开 Cursor 设置
  3. 转到 Model Context Protocol
  4. 添加新的 MCP 服务器,使用以下 JSON 配置: json { "command": "npx", "args": [ "-y", "@smithery/cli@latest", "run", "@cancelei/mcp_test_booking", "--config", "{\"AGENTQL_API_KEY\":\"your_api_key_here\"}" ] }
  5. 本地开发安装:
  6. 运行服务器: bash ruby server.rb

调试方式

  1. 使用 fetch_website 工具: ruby response = call_tool("fetch_website", { url: "https://example.com" })
  2. 使用 extract_content 工具: ```ruby selectors = { title: "title", headings: "h1, h2", main_content: ".main-content p" }.to_json

response = call_tool("extract_content", { url: "https://example.com", selectors_json: selectors }) ```

许可证

该项目遵循 MIT 开源许可条款。