Ebook-MCP

Ebook-MCP

site icon
2025.04.15 8
Python电子书处理自然语言交互内容生成
Ebook-MCP 是一个基于 Model Context Protocol (MCP) 的电子书处理服务器,支持 EPUB 和 PDF 格式。它提供了一套标准化的 API,用于将 LLM 应用程序与电子书处理能力无缝集成。主要功能包括智能图书馆管理、交互式阅读体验、主动学习支持和内容导航。
View on GitHub

Overview

基本能力

产品定位

Ebook-MCP 是一个电子书处理服务器,旨在通过自然语言交互增强用户与电子书的互动体验。

核心功能

  1. EPUB 支持
  2. 提取元数据(标题、作者、出版日期等)
  3. 提取目录
  4. 提取章节内容(支持 Markdown 输出)
  5. 批量处理 EPUB 文件

  6. PDF 支持

  7. 提取元数据(标题、作者、创建日期等)
  8. 提取目录
  9. 按页码提取内容
  10. 按章节标题提取内容
  11. 支持 Markdown 输出
  12. 批量处理 PDF 文件

适用场景

  • 智能图书馆管理
  • 交互式阅读体验
  • 主动学习支持
  • 内容导航

工具列表

  1. get_all_epub_files: 获取指定目录中的所有 EPUB 文件
  2. get_metadata: 从 EPUB 文件中获取元数据
  3. get_toc: 从 EPUB 文件中获取目录
  4. get_chapter_markdown: 获取章节内容的 Markdown 格式
  5. get_all_pdf_files: 获取指定目录中的所有 PDF 文件
  6. get_pdf_metadata: 从 PDF 文件中获取元数据
  7. get_pdf_toc: 从 PDF 文件中获取目录
  8. get_pdf_page_text: 获取特定页面的纯文本内容
  9. get_pdf_page_markdown: 获取特定页面的 Markdown 格式内容
  10. get_pdf_chapter_content: 按章节标题获取章节内容和对应的页码

常见问题解答

  1. PDF 处理依赖于文档的目录。如果目录不可用,某些功能可能无法工作。
  2. 对于大型 PDF 文件,建议按页面范围处理,以避免一次性加载整个文件。
  3. EPUB 章节 ID 必须从目录结构中获取。

使用教程

使用依赖

  1. 克隆仓库:
git clone https://github.com/yourusername/ebook-mcp.git
cd ebook-mcp
  1. 使用 uv 安装依赖:
uv pip install -r requirements.txt

安装教程

  1. 克隆仓库并安装依赖(如上所述)。

调试方式

  1. 在开发模式下运行服务器:
uv run mcp dev main.py

访问 http://localhost:5173/ 进行测试和调试。

  1. 在生产模式下运行服务器:
uv run main.py
  1. 在 Cursor 中配置 MCP:
"ebook-mcp":{
            "command": "uv",
            "args": [
                "--directory",
                "/Users/onebird/github/ebook-mcp",
                "run",
                "main.py"
            ]
        }

许可证

该项目遵循 Apache-2.0 开源许可条款,请参阅 Apache-2.0 了解完整条款。