Simple Document Processing MCP Server

Simple Document Processing MCP Server

site icon
2025.02.27 9
TypeScript文档处理文本处理HTML 处理内容生成
mcp-doc-forge 是一个强大的文档处理 MCP 服务器,提供全面的文档处理能力,包括文档读取、格式转换、文本处理和 HTML 处理等功能。适用于需要高效处理多种文档格式的开发者和团队。
View on GitHub

Overview

基本能力

产品定位

mcp-doc-forge 是一个专注于文档处理的 MCP 服务器,旨在提供高效的文档读取、转换和处理能力。

核心功能

  1. 文档读取:支持 DOCX、PDF、TXT、HTML、CSV 等多种格式的文档读取。
  2. 文档转换
  3. DOCX 到 HTML/PDF 的转换
  4. HTML 到 TXT/Markdown 的转换
  5. PDF 操作(合并、拆分)
  6. 文本处理
  7. 多编码转换支持(UTF-8、Big5、GBK)
  8. 文本格式化和清理
  9. 文本比较和差异生成
  10. 按行或分隔符拆分文本
  11. HTML 处理
  12. HTML 清理和格式化
  13. 资源提取(图片、链接、视频)
  14. 结构保留转换

适用场景

  1. 文档格式转换:适用于需要将文档从一种格式转换为另一种格式的场景。
  2. 文本处理:适用于需要对文本进行清理、格式化或比较的场景。
  3. HTML 处理:适用于需要从 HTML 中提取资源或进行格式化的场景。

工具列表

  1. Smithery:用于自动安装 mcp-doc-forge。
  2. Dive Desktop:用于手动配置和运行 mcp-doc-forge。

常见问题解答

  1. 如何安装 mcp-doc-forge?
  2. 可以通过 Smithery 自动安装或手动安装。
  3. 如何配置 mcp-doc-forge?
  4. 可以通过 Dive Desktop 进行配置。

使用教程

使用依赖

  1. Node.js:确保已安装 Node.js。

安装教程

  1. 通过 Smithery 安装bash npx -y @smithery/cli install @cablate/mcp-doc-forge --client claude
  2. 手动安装bash npm install -g @cablate/mcp-doc-forge

调试方式

  1. 命令行运行bash mcp-doc-forge
  2. 通过 Dive Desktop 运行
  3. 在 Dive Desktop 中点击 "+ Add MCP Server"。
  4. 复制并粘贴提供的配置。
  5. 点击 "Save" 保存并安装 MCP 服务器。

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。