Website Info MCP Server

Website Info MCP Server

2025.03.18 0

Ruby网页内容提取自动化抓取内容生成

mcp_test_booking 是一个基于 Model Context Protocol (MCP) 的服务器，专门用于从网站提取信息。它利用 AgentQL API 提供强大的网页内容抓取和提取功能。该服务适用于需要自动化获取和处理网页内容的场景，如数据分析、内容聚合和信息监控。

View on GitHub

Overview

基本能力

产品定位

mcp_test_booking 是一个专门用于从网站提取信息的 MCP 服务器，适用于需要自动化获取和处理网页内容的场景。

核心功能

fetch_website: 抓取整个网站的内容，包括标题、内容、链接和图片。
extract_content: 使用 CSS 选择器提取特定内容，支持复杂选择器。
资源访问: 通过 website://info 资源获取网站信息。

适用场景

数据分析
内容聚合
信息监控

工具列表

fetch_website: 抓取整个网站的内容。
extract_content: 使用 CSS 选择器提取特定内容。

常见问题解答

Q: 如何设置 AgentQL API 密钥？ A: 通过环境变量 AGENTQL_API_KEY 设置。
Q: 服务器默认端口是多少？ A: 默认端口为 3000。

使用教程

使用依赖

安装依赖： bash bundle install
设置环境变量： bash export AGENTQL_API_KEY=your_api_key

安装教程

使用 Cursor 安装：
打开 Cursor 设置
转到 Model Context Protocol
添加新的 MCP 服务器，使用以下 JSON 配置： json { "command": "npx", "args": [ "-y", "@smithery/cli@latest", "run", "@cancelei/mcp_test_booking", "--config", "{\"AGENTQL_API_KEY\":\"your_api_key_here\"}" ] }
本地开发安装：
运行服务器： bash ruby server.rb

调试方式

使用 fetch_website 工具： ruby response = call_tool("fetch_website", { url: "https://example.com" })
使用 extract_content 工具： ```ruby selectors = { title: "title", headings: "h1, h2", main_content: ".main-content p" }.to_json

response = call_tool("extract_content", { url: "https://example.com", selectors_json: selectors }) ```

许可证

该项目遵循 MIT 开源许可条款。