MCP Fetch

MCP Fetch

site icon
2025.04.14 15
JavaScript网页内容提取图像处理浏览器自动化内容生成
MCP Fetch 是一个基于 Model Context Protocol 的服务,主要用于获取网页内容并处理图像。它允许 Claude Desktop 或其他 MCP 客户端获取网页内容并适当处理图像。该服务提供了网页内容提取、文章标题提取、图像处理等功能,适用于需要自动化获取和处理网页内容的场景。
View on GitHub

Overview

基本能力

产品定位

MCP Fetch 是一个用于获取网页内容并处理图像的服务,旨在为 Claude Desktop 或其他 MCP 客户端提供网页内容提取和图像处理的能力。

核心功能

  • Web Content Extraction: 自动提取并以 Markdown 格式格式化网页内容
  • Article Title Extraction: 提取并显示文章的标题
  • Image Processing: 可选处理网页中的图像并进行优化(默认禁用,可通过 enableFetchImages: true 启用)
  • Pagination Support: 支持文本和图像的分页
  • JPEG Optimization: 自动优化图像为 JPEG 以提高性能
  • GIF Support: 从动画 GIF 中提取第一帧

适用场景

  • 自动化获取网页内容
  • 处理网页中的图像
  • 提取文章标题
  • 分页处理大量内容

工具列表

  • npx: 用于运行 MCP Fetch
  • tsx: 用于开发和修改工具

常见问题解答

  • Q: 为什么需要启用 Accessibility 设置? A: 这是为了确保自动剪贴板操作(Cmd+V)能够正常工作。
  • Q: 是否支持 Windows 或 Linux? A: 不支持,该工具仅适用于 macOS,因为它依赖于 macOS 特定的剪贴板操作。

使用教程

使用依赖

  • Node.js 18+
  • macOS(用于剪贴板操作)
  • Claude Desktop(从 https://claude.ai/desktop 安装)
  • tsx(通过 npm install -g tsx 安装)

安装教程

git clone https://github.com/kazuph/mcp-fetch.git
cd mcp-fetch
npm install
npm run build

调试方式

  1. 确保 Claude Desktop 已安装并运行。
  2. 全局安装 tsx(如果尚未安装):
npm install -g tsx
# 或
pnpm add -g tsx
  1. 修改 Claude Desktop 配置文件(位于 ~/Library/Application Support/Claude/claude_desktop_config.json)以包含 MCP Fetch 的配置。

配置示例

基本内容获取(无图像)

{
  "url": "https://example.com"
}

启用图像获取

{
  "url": "https://example.com",
  "enableFetchImages": true,
  "imageMaxCount": 3
}

分页获取图像

{
  "url": "https://example.com",
  "enableFetchImages": true,
  "imageStartIndex": 3,
  "imageMaxCount": 3
}

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。