pymupdf4llm-mcp

pymupdf4llm-mcp

site icon
2025.04.23 0
PythonPDF转换Markdown生成内容生成
pymupdf4llm-mcp 是一个专门用于将PDF文档转换为Markdown格式的MCP服务器,特别适用于为大型语言模型(LLM)准备数据。它提供了高效、准确的PDF到Markdown的转换能力,帮助用户更好地处理和利用PDF文档中的信息。
View on GitHub

Overview

基本能力

产品定位

pymupdf4llm-mcp 是一个专注于PDF到Markdown转换的工具,旨在为大型语言模型(LLM)提供高质量的文本数据。

核心功能

  • 将PDF文档转换为Markdown格式
  • 支持两种运行模式:stdio和sse
  • 高效、准确的转换能力

适用场景

  • 为LLM准备训练数据
  • 从PDF文档中提取结构化文本
  • 自动化文档处理流程

工具列表

  • uvx:用于运行pymupdf4llm-mcp服务器的命令行工具

常见问题解答

暂无提供

使用教程

使用依赖

无明确前置依赖,但需要安装uvx工具来运行服务器。

安装教程

运行以下命令来启动MCP服务器:

uvx pymupdf4llm-mcp@latest stdio # stdio模式
# 或
uvx pymupdf4llm-mcp@latest sse # sse模式

调试方式

配置MCP客户端(如cursor/windsurf等)连接到该服务器:

{
  "mcpServers": {
    "pymupdf4llm-mcp": {
      "command": "uvx",
      "args": [
        "pymupdf4llm-mcp@latest",
        "stdio"
      ],
      "env": {}
    }
  }
}

许可证

该项目遵循 BSD-3-Clause 开源许可条款,请参阅 BSD-3-Clause 了解完整条款。