
Simple Document Processing MCP Server

2025.02.27
9
TypeScript文档处理文本处理HTML 处理内容生成
mcp-doc-forge 是一个强大的文档处理 MCP 服务器,提供全面的文档处理能力,包括文档读取、格式转换、文本处理和 HTML 处理等功能。适用于需要高效处理多种文档格式的开发者和团队。
View on GitHub
Overview
基本能力
产品定位
mcp-doc-forge 是一个专注于文档处理的 MCP 服务器,旨在提供高效的文档读取、转换和处理能力。
核心功能
- 文档读取:支持 DOCX、PDF、TXT、HTML、CSV 等多种格式的文档读取。
- 文档转换:
- DOCX 到 HTML/PDF 的转换
- HTML 到 TXT/Markdown 的转换
- PDF 操作(合并、拆分)
- 文本处理:
- 多编码转换支持(UTF-8、Big5、GBK)
- 文本格式化和清理
- 文本比较和差异生成
- 按行或分隔符拆分文本
- HTML 处理:
- HTML 清理和格式化
- 资源提取(图片、链接、视频)
- 结构保留转换
适用场景
- 文档格式转换:适用于需要将文档从一种格式转换为另一种格式的场景。
- 文本处理:适用于需要对文本进行清理、格式化或比较的场景。
- HTML 处理:适用于需要从 HTML 中提取资源或进行格式化的场景。
工具列表
- Smithery:用于自动安装 mcp-doc-forge。
- Dive Desktop:用于手动配置和运行 mcp-doc-forge。
常见问题解答
- 如何安装 mcp-doc-forge?
- 可以通过 Smithery 自动安装或手动安装。
- 如何配置 mcp-doc-forge?
- 可以通过 Dive Desktop 进行配置。
使用教程
使用依赖
- Node.js:确保已安装 Node.js。
安装教程
- 通过 Smithery 安装:
bash npx -y @smithery/cli install @cablate/mcp-doc-forge --client claude
- 手动安装:
bash npm install -g @cablate/mcp-doc-forge
调试方式
- 命令行运行:
bash mcp-doc-forge
- 通过 Dive Desktop 运行:
- 在 Dive Desktop 中点击 "+ Add MCP Server"。
- 复制并粘贴提供的配置。
- 点击 "Save" 保存并安装 MCP 服务器。