
MCP Webscan Server

2025.02.17
0
JavaScript网页扫描内容分析链接检查站点爬取浏览器自动化开发效率
MCP Webscan Server 是一个基于 Model Context Protocol (MCP) 的服务器,专注于网页内容的扫描和分析。它提供了一系列工具,用于抓取、分析和提取网页信息,适用于网页内容分析、链接检查、站点爬取等场景。
View on GitHub
Overview
基本能力
产品定位
MCP Webscan Server 是一个专门用于网页内容扫描和分析的工具,旨在帮助用户高效地获取和处理网页信息。
核心功能
- 页面抓取:将网页转换为 Markdown 格式,便于分析
- 链接提取:从网页中提取并分析链接
- 站点爬取:递归爬取网站内容
- 链接检查:识别网页中的失效链接
- 模式匹配:查找符合特定模式的 URL
- 站点地图生成:为网站生成 XML 站点地图
适用场景
- 网页内容分析
- 网站链接检查
- 网站内容爬取
- 站点地图生成
- 网页数据提取
工具列表
fetch_page
:抓取网页并转换为 Markdownextract_links
:提取网页中的所有链接及其文本crawl_site
:递归爬取网站内容check_links
:检查网页中的失效链接find_patterns
:查找符合特定模式的 URLgenerate_sitemap
:生成 XML 站点地图
常见问题解答
- 错误处理:服务器实现了全面的错误处理,包括无效参数、网络错误、内容解析错误和 URL 验证
- 开发模式:支持开发模式,便于调试
使用教程
使用依赖
- Node.js >= 18
- npm
安装教程
# 克隆仓库
git clone <repository-url>
cd mcp-server-webscan
# 安装依赖
npm install
# 构建项目
npm run build
调试方式
# 启动服务器
npm start
# 开发模式
npm run dev