Fetch MCP Server

Fetch MCP Server

site icon
2024.12.20 1
网页内容抓取数据转换搜索工具浏览器自动化
Fetch MCP Server 是一个用于获取网页内容的服务,支持多种格式的输出,包括HTML、JSON、纯文本和Markdown。它通过现代fetch API获取网页内容,并支持自定义请求头,适用于需要从网页中提取和处理数据的场景。
View on GitHub

Overview

基本能力

产品定位

Fetch MCP Server 是一个专门用于获取和转换网页内容的服务,适用于需要从网页中提取和处理数据的场景。

核心功能

  • 使用现代fetch API获取网页内容
  • 支持自定义请求头
  • 提供多种格式的输出:HTML、JSON、纯文本和Markdown
  • 使用JSDOM进行HTML解析和文本提取
  • 使用TurndownService进行HTML到Markdown的转换

适用场景

  • 网页内容抓取和分析
  • 数据聚合和处理
  • 自动化测试和爬虫开发
  • 内容转换和格式化

工具列表

  • fetch_html: 获取网页内容并返回HTML格式
  • fetch_json: 获取JSON文件并返回解析后的JSON内容
  • fetch_txt: 获取网页内容并返回纯文本格式(去除HTML标签、脚本和样式)
  • fetch_markdown: 获取网页内容并转换为Markdown格式

常见问题解答

  • 无特定常见问题解答内容

使用教程

使用依赖

  1. 确保已安装Node.js和npm
  2. 克隆项目仓库

安装教程

  1. 安装依赖: npm install
  2. 构建服务器: npm run build
  3. 启动服务器: npm start

调试方式

  • 开发模式: npm run dev 启动TypeScript编译器在监视模式下运行
  • 测试: npm test 运行测试套件

许可证

该项目遵循 MIT 开源许可条款。