Website to PDF MCP Server

Website to PDF MCP Server

site icon
2025.04.23 0
JavaScript网页转PDF内容存档内容生成
website-to-pdf-mcp 是一个用于将网页(包括需要认证的网页)转换为 PDF 文档的服务。它能够抓取单个网页或遍历网页上的链接,并将多个页面合并为一个 PDF 文件。该服务支持通过用户名和密码进行认证,并允许配置链接遍历的最大页面限制。
View on GitHub

Overview

基本能力

产品定位

website-to-pdf-mcp 是一个专门用于将网页内容转换为 PDF 文档的服务,适用于需要将网页内容存档或离线阅读的场景。

核心功能

  • 将单个网页转换为 PDF
  • 遍历网页上的链接并将多个页面合并为一个 PDF 文件
  • 支持通过用户名和密码进行认证
  • 可配置链接遍历的最大页面限制

适用场景

  • 网页内容存档
  • 离线阅读网页内容
  • 批量抓取网页并生成 PDF 报告

工具列表

  • Puppeteer: 用于网页渲染和 PDF 生成

常见问题解答

  • 如何自定义 PDF 生成参数? 可以通过修改 websiteToPdf 函数中的 Puppeteer 选项来自定义 PDF 生成参数,如页面格式、背景渲染、页边距等。
  • 如何处理不同类型的认证? 默认实现支持简单的用户名/密码表单认证,如需处理其他类型的认证,可能需要自定义认证逻辑。

使用教程

使用依赖

  1. 确保已安装 Node.js 和 npm

安装教程

  1. 克隆仓库
  2. 安装依赖: npm install
  3. 复制示例环境文件: cp .env.example .env
  4. 启动服务: npm start

调试方式

  1. 确保服务已启动
  2. 使用 API 端点进行测试: POST /api/convert 请求体示例: json { "url": "https://example.com", "username": "optional-username", "password": "optional-password", "filename": "optional-custom-filename.pdf", "traverseLinks": true, "maxPages": 10 }

许可证

该项目遵循 None 开源许可条款。