Florence-2 MCP Server

Florence-2 MCP Server

site icon
2025.03.28 1
Python图像处理文本提取内容生成
Florence-2 MCP Server 是一个基于 Florence-2 模型的 MCP 服务器,主要用于处理图像和 PDF 文件。它能够通过 OCR(光学字符识别)技术从图像中提取文本,或者生成描述图像内容的摘要。该服务器适用于需要图像处理和文本提取的各种场景。
View on GitHub

Overview

基本能力

产品定位

Florence-2 MCP Server 是一个基于 Florence-2 模型的 MCP 服务器,主要用于处理图像和 PDF 文件。

核心功能

  • 通过 OCR(光学字符识别)技术从图像中提取文本
  • 生成描述图像内容的摘要

适用场景

  • 需要从图像中提取文本的场景
  • 需要生成图像内容摘要的场景

工具列表

  • ocr: 处理图像文件或 URL,使用 OCR 提取文本
  • 参数: src - 需要处理的图像文件路径或 URL
  • caption: 处理图像文件并生成图像内容的描述
  • 参数: src - 需要处理的图像文件路径或 URL

使用教程

使用依赖

无明确的前置依赖要求。

安装教程

对于 Claude Desktop

编辑 claude_desktop_config.json 文件,在 mcpServers 下添加以下内容:

{
  "mcpServers": {
    "florence-2": {
      "command": "uvx",
      "args": [
        "--from",
        "git+https://github.com/jkawamoto/mcp-florence2",
        "mcp-florence2"
      ]
    }
  }
}

编辑后重启应用。

对于 Goose CLI

编辑配置文件 ~/.config/goose/config.yaml,添加以下内容:

extensions:
  bear:
    name: Florence-2
    cmd: uvx
    args: [ --from, git+https://github.com/jkawamoto/mcp-florence2, mcp-florence2 ]
    enabled: true
    type: stdio

对于 Goose Desktop

添加新扩展,设置如下: - Type: Standard IO - ID: florence-2 - Name: Florence-2 - Description: An MCP server for processing images using Florence-2 - Command: uvx --from git+https://github.com/jkawamoto/mcp-florence2 mcp-florence2

调试方式

无明确的调试命令提供。

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。