
pymupdf4llm-mcp

2025.04.23
0
PythonPDF转换Markdown生成内容生成
pymupdf4llm-mcp 是一个专门用于将PDF文档转换为Markdown格式的MCP服务器,特别适用于为大型语言模型(LLM)准备数据。它提供了高效、准确的PDF到Markdown的转换能力,帮助用户更好地处理和利用PDF文档中的信息。
View on GitHub
Overview
基本能力
产品定位
pymupdf4llm-mcp 是一个专注于PDF到Markdown转换的工具,旨在为大型语言模型(LLM)提供高质量的文本数据。
核心功能
- 将PDF文档转换为Markdown格式
- 支持两种运行模式:stdio和sse
- 高效、准确的转换能力
适用场景
- 为LLM准备训练数据
- 从PDF文档中提取结构化文本
- 自动化文档处理流程
工具列表
uvx
:用于运行pymupdf4llm-mcp服务器的命令行工具
常见问题解答
暂无提供
使用教程
使用依赖
无明确前置依赖,但需要安装uvx
工具来运行服务器。
安装教程
运行以下命令来启动MCP服务器:
uvx pymupdf4llm-mcp@latest stdio # stdio模式
# 或
uvx pymupdf4llm-mcp@latest sse # sse模式
调试方式
配置MCP客户端(如cursor/windsurf等)连接到该服务器:
{
"mcpServers": {
"pymupdf4llm-mcp": {
"command": "uvx",
"args": [
"pymupdf4llm-mcp@latest",
"stdio"
],
"env": {}
}
}
}