
Website to PDF MCP Server

2025.04.23
0
JavaScript网页转PDF内容存档内容生成
website-to-pdf-mcp 是一个用于将网页(包括需要认证的网页)转换为 PDF 文档的服务。它能够抓取单个网页或遍历网页上的链接,并将多个页面合并为一个 PDF 文件。该服务支持通过用户名和密码进行认证,并允许配置链接遍历的最大页面限制。
View on GitHub
Overview
基本能力
产品定位
website-to-pdf-mcp 是一个专门用于将网页内容转换为 PDF 文档的服务,适用于需要将网页内容存档或离线阅读的场景。
核心功能
- 将单个网页转换为 PDF
- 遍历网页上的链接并将多个页面合并为一个 PDF 文件
- 支持通过用户名和密码进行认证
- 可配置链接遍历的最大页面限制
适用场景
- 网页内容存档
- 离线阅读网页内容
- 批量抓取网页并生成 PDF 报告
工具列表
- Puppeteer: 用于网页渲染和 PDF 生成
常见问题解答
- 如何自定义 PDF 生成参数?
可以通过修改
websiteToPdf
函数中的 Puppeteer 选项来自定义 PDF 生成参数,如页面格式、背景渲染、页边距等。 - 如何处理不同类型的认证? 默认实现支持简单的用户名/密码表单认证,如需处理其他类型的认证,可能需要自定义认证逻辑。
使用教程
使用依赖
- 确保已安装 Node.js 和 npm
安装教程
- 克隆仓库
- 安装依赖:
npm install
- 复制示例环境文件:
cp .env.example .env
- 启动服务:
npm start
调试方式
- 确保服务已启动
- 使用 API 端点进行测试:
POST /api/convert
请求体示例:json { "url": "https://example.com", "username": "optional-username", "password": "optional-password", "filename": "optional-custom-filename.pdf", "traverseLinks": true, "maxPages": 10 }