Site Cloner MCP Server

Site Cloner MCP Server

site icon
2025.04.19 0
Python网站克隆网站分析资源下载搜索工具开发效率
Site Cloner MCP Server 是一个基于 Model Context Protocol (MCP) 的服务,旨在帮助大型语言模型(如 Claude)克隆网站。它提供了多种工具来获取、分析和下载网站资源,包括 HTML 内容、CSS、JavaScript、图片、字体等。
View on GitHub

Overview

基本能力

产品定位

Site Cloner MCP Server 是一个用于克隆网站的工具,帮助用户快速获取和分析网站内容。

核心功能

  • 从任何 URL 获取 HTML 内容
  • 从 HTML 内容中提取资源(CSS、JavaScript、图片、字体等)
  • 下载单个资源到本地目录
  • 解析 CSS 文件以提取链接资源(字体、图片)
  • 创建网站的地图
  • 分析页面结构和布局

适用场景

  • 网站克隆和分析
  • 网站内容备份
  • 网站结构研究

工具列表

  1. fetch_page: 获取网页的 HTML 内容
  2. extract_assets: 从 HTML 内容中提取资源链接
  3. download_asset: 从 URL 下载资源并保存到指定目录
  4. parse_css_for_assets: 解析 CSS 内容以提取引用的资源(如字体和图片)
  5. create_site_map: 从给定 URL 开始创建网站的站点地图
  6. analyze_page_structure: 分析 HTML 页面的结构并提取关键组件

常见问题解答

  • 服务器未在 Cursor 中显示: 重启 Cursor,检查配置文件语法,确保 Docker 已正确安装并运行。
  • 模块未找到错误: 检查 pyproject.toml 中的包名是否正确,确保 Python 文件中的导入语句不包含 "src." 前缀。
  • 检查 Docker 日志: 使用 docker logs 命令查看错误日志。

使用教程

使用依赖

  • 需要安装 Docker

安装教程

  1. 构建 Docker 镜像: bash docker build -t site-cloner-mcp .
  2. 运行容器: bash docker run -i --rm site-cloner-mcp
  3. 如需持久存储下载的文件,可以挂载卷: bash docker run -i --rm -v $(pwd)/downloaded_sites:/app/downloaded_site site-cloner-mcp

调试方式

  1. 检查 Docker 日志: bash docker logs $(docker ps -q --filter ancestor=site-cloner-mcp)
  2. 手动运行服务器以查看错误: bash docker run -i --rm site-cloner-mcp

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。