
Website Info MCP Server

2025.03.18
0
Ruby网页内容提取自动化抓取内容生成
mcp_test_booking 是一个基于 Model Context Protocol (MCP) 的服务器,专门用于从网站提取信息。它利用 AgentQL API 提供强大的网页内容抓取和提取功能。该服务适用于需要自动化获取和处理网页内容的场景,如数据分析、内容聚合和信息监控。
View on GitHub
Overview
基本能力
产品定位
mcp_test_booking 是一个专门用于从网站提取信息的 MCP 服务器,适用于需要自动化获取和处理网页内容的场景。
核心功能
- fetch_website: 抓取整个网站的内容,包括标题、内容、链接和图片。
- extract_content: 使用 CSS 选择器提取特定内容,支持复杂选择器。
- 资源访问: 通过
website://info
资源获取网站信息。
适用场景
- 数据分析
- 内容聚合
- 信息监控
工具列表
- fetch_website: 抓取整个网站的内容。
- extract_content: 使用 CSS 选择器提取特定内容。
常见问题解答
- Q: 如何设置 AgentQL API 密钥?
A: 通过环境变量
AGENTQL_API_KEY
设置。 - Q: 服务器默认端口是多少? A: 默认端口为 3000。
使用教程
使用依赖
- 安装依赖:
bash bundle install
- 设置环境变量:
bash export AGENTQL_API_KEY=your_api_key
安装教程
- 使用 Cursor 安装:
- 打开 Cursor 设置
- 转到 Model Context Protocol
- 添加新的 MCP 服务器,使用以下 JSON 配置:
json { "command": "npx", "args": [ "-y", "@smithery/cli@latest", "run", "@cancelei/mcp_test_booking", "--config", "{\"AGENTQL_API_KEY\":\"your_api_key_here\"}" ] }
- 本地开发安装:
- 运行服务器:
bash ruby server.rb
调试方式
- 使用
fetch_website
工具:ruby response = call_tool("fetch_website", { url: "https://example.com" })
- 使用
extract_content
工具: ```ruby selectors = { title: "title", headings: "h1, h2", main_content: ".main-content p" }.to_json
response = call_tool("extract_content", { url: "https://example.com", selectors_json: selectors }) ```