
Florence-2 MCP Server

2025.03.28
1
Python图像处理文本提取内容生成
Florence-2 MCP Server 是一个基于 Florence-2 模型的 MCP 服务器,主要用于处理图像和 PDF 文件。它能够通过 OCR(光学字符识别)技术从图像中提取文本,或者生成描述图像内容的摘要。该服务器适用于需要图像处理和文本提取的各种场景。
View on GitHub
Overview
基本能力
产品定位
Florence-2 MCP Server 是一个基于 Florence-2 模型的 MCP 服务器,主要用于处理图像和 PDF 文件。
核心功能
- 通过 OCR(光学字符识别)技术从图像中提取文本
- 生成描述图像内容的摘要
适用场景
- 需要从图像中提取文本的场景
- 需要生成图像内容摘要的场景
工具列表
- ocr: 处理图像文件或 URL,使用 OCR 提取文本
- 参数:
src
- 需要处理的图像文件路径或 URL - caption: 处理图像文件并生成图像内容的描述
- 参数:
src
- 需要处理的图像文件路径或 URL
使用教程
使用依赖
无明确的前置依赖要求。
安装教程
对于 Claude Desktop
编辑 claude_desktop_config.json
文件,在 mcpServers
下添加以下内容:
{
"mcpServers": {
"florence-2": {
"command": "uvx",
"args": [
"--from",
"git+https://github.com/jkawamoto/mcp-florence2",
"mcp-florence2"
]
}
}
}
编辑后重启应用。
对于 Goose CLI
编辑配置文件 ~/.config/goose/config.yaml
,添加以下内容:
extensions:
bear:
name: Florence-2
cmd: uvx
args: [ --from, git+https://github.com/jkawamoto/mcp-florence2, mcp-florence2 ]
enabled: true
type: stdio
对于 Goose Desktop
添加新扩展,设置如下:
- Type: Standard IO
- ID: florence-2
- Name: Florence-2
- Description: An MCP server for processing images using Florence-2
- Command: uvx --from git+https://github.com/jkawamoto/mcp-florence2 mcp-florence2
调试方式
无明确的调试命令提供。