mcp-server-fetch-typescript MCP Server

mcp-server-fetch-typescript MCP Server

site icon
2025.02.17 0
JavaScript网页内容抓取数据提取网页渲染内容转换浏览器自动化内容生成
mcp-server-fetch-typescript 是一个基于 Model Context Protocol 的服务器,提供网页内容抓取和转换功能。该服务器实现了一个全面的网页内容检索系统,支持多种格式和渲染方法,适用于从简单的数据提取到复杂的网页抓取任务。
View on GitHub

Overview

基本能力

产品定位

mcp-server-fetch-typescript 是一个专门用于网页内容抓取和转换的工具,支持多种格式和渲染方法,适用于数据提取和网页抓取任务。

核心功能

  1. get_raw_text - 直接从 URL 获取原始文本内容
  2. 适用于 JSON、XML、CSV、TSV 或纯文本文件
  3. 无需浏览器渲染,快速访问源内容

  4. get_rendered_html - 获取完全渲染的 HTML 内容

  5. 使用 Playwright 进行无头浏览器渲染
  6. 适用于现代网页应用和单页应用 (SPA)

  7. get_markdown - 将网页内容转换为 Markdown 格式

  8. 保留结构化元素,支持表格和定义列表
  9. 适用于内容存档和文档生成

  10. get_markdown_summary - 提取并转换主要内容

  11. 自动移除导航、页眉、页脚等无关内容
  12. 适用于文章和博客内容提取

适用场景

  • 数据提取和分析
  • 网页内容存档
  • 自动化测试
  • 内容生成和文档转换

工具列表

  • get_raw_text: 直接从 URL 获取原始文本内容
  • get_rendered_html: 获取完全渲染的 HTML 内容
  • get_markdown: 将网页内容转换为 Markdown 格式
  • get_markdown_summary: 提取并转换主要内容

使用教程

使用依赖

确保已安装 Node.js 和 npm。

安装教程

作为全局包安装

npm install -g mcp-server-fetch-typescript

作为项目依赖安装

npm install mcp-server-fetch-typescript

从源代码安装

git clone https://github.com/tatn/mcp-server-fetch-typescript.git
cd mcp-server-fetch-typescript
npm install
npm run build

调试方式

使用以下命令调试 MCP 服务器:

npx @modelcontextprotocol/inspector npx -y mcp-server-fetch-typescript

npx @modelcontextprotocol/inspector node /path/to/mcp-server-fetch-typescript/build/index.js

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。