
Fetch MCP Server

2024.12.20
1
网页内容抓取数据转换搜索工具浏览器自动化
Fetch MCP Server 是一个用于获取网页内容的服务,支持多种格式的输出,包括HTML、JSON、纯文本和Markdown。它通过现代fetch API获取网页内容,并支持自定义请求头,适用于需要从网页中提取和处理数据的场景。
View on GitHub
Overview
基本能力
产品定位
Fetch MCP Server 是一个专门用于获取和转换网页内容的服务,适用于需要从网页中提取和处理数据的场景。
核心功能
- 使用现代fetch API获取网页内容
- 支持自定义请求头
- 提供多种格式的输出:HTML、JSON、纯文本和Markdown
- 使用JSDOM进行HTML解析和文本提取
- 使用TurndownService进行HTML到Markdown的转换
适用场景
- 网页内容抓取和分析
- 数据聚合和处理
- 自动化测试和爬虫开发
- 内容转换和格式化
工具列表
- fetch_html: 获取网页内容并返回HTML格式
- fetch_json: 获取JSON文件并返回解析后的JSON内容
- fetch_txt: 获取网页内容并返回纯文本格式(去除HTML标签、脚本和样式)
- fetch_markdown: 获取网页内容并转换为Markdown格式
常见问题解答
- 无特定常见问题解答内容
使用教程
使用依赖
- 确保已安装Node.js和npm
- 克隆项目仓库
安装教程
- 安装依赖:
npm install
- 构建服务器:
npm run build
- 启动服务器:
npm start
调试方式
- 开发模式:
npm run dev
启动TypeScript编译器在监视模式下运行 - 测试:
npm test
运行测试套件