
WORK IN PROGRESS - USE WITH CAUTION - Windows:

2024.12.23
30
PythonPDF处理文件合并文本提取文件管理
MCP PDF Tools Server 是一个基于 Model Context Protocol (MCP) 的服务,专门用于 PDF 文件的操作和管理。它提供了多种 PDF 处理功能,包括合并 PDF 文件、提取特定页面、搜索 PDF 内容以及基于文本提取和正则表达式匹配查找相关 PDF 文件等。
View on GitHub
Overview
基本能力
产品定位
MCP PDF Tools Server 是一个专门用于 PDF 文件操作和管理的服务,通过 Model Context Protocol (MCP) 提供 PDF 文件的多种处理功能。
核心功能
- 合并多个 PDF 文件为一个 PDF
- 按用户指定顺序合并多个 PDF 文件
- 从 PDF 文件中提取特定页面
- 搜索 PDF 文件内容
- 基于文本提取和正则表达式匹配查找并合并相关 PDF 文件
适用场景
- 需要批量处理 PDF 文件的场景
- 需要从大型 PDF 文件中提取特定信息的场景
- 需要合并多个相关 PDF 文件的场景
使用教程
使用依赖
- 确保已安装 Python 和 uv 工具
安装教程
- 克隆仓库
- 执行以下命令:
cd mcp-pdf-tools
# 创建并激活虚拟环境
uv venv
.venv\Scripts\activate
# 安装包
uv pip install -e .
调试方式
在 Claude Desktop 配置文件中添加以下内容以使用该服务:
{
"mcpServers": {
"pdf-tools": {
"command": "uv",
"args": [
"--directory",
"PATH_TO\\mcp-pdf-tools",
"run",
"pdf-tools"
]
}
}
}