MCP OpenVision

MCP OpenVision

2025.04.01 4

Python图像分析AI视觉内容生成

MCP OpenVision 是一个基于 Model Context Protocol (MCP) 的服务，专注于提供图像分析能力。它利用 OpenRouter 的视觉模型，为 AI 助手提供简单的图像分析接口。该服务支持多种图像输入方式，包括 Base64 编码、URL 和本地文件路径，并能根据用户提供的查询进行详细的图像分析。

View on GitHub

Overview

基本能力

产品定位

MCP OpenVision 是一个图像分析服务，旨在通过 AI 视觉模型帮助用户理解和分析图像内容。

核心功能

图像分析：支持多种图像输入方式（Base64、URL、本地文件路径）
自定义查询：用户可提供详细的查询指令，指导模型进行特定分析
多模型支持：兼容 OpenRouter 上的多种视觉模型
参数定制：可调整温度、最大令牌数等模型参数

适用场景

零售产品识别与价格估算
医学图像分析
图表数据提取
文本转录（如菜单、文档等）
艺术分析

工具列表

image_analysis：核心图像分析工具，支持多种输入格式和详细查询

常见问题解答

需要 OpenRouter API 密钥才能使用
支持相对路径和绝对路径的图像输入
可通过环境变量配置默认模型

使用教程

使用依赖

需要 Python 环境和 OpenRouter API 密钥

安装教程

# 通过 pip 安装
pip install mcp-openvision

# 通过 UV 安装（推荐）
uv pip install mcp-openvision

# 通过 Smithery 安装
npx -y @smithery/cli install @Nazruden/mcp-openvision --client claude

调试方式

# 设置 API 密钥
export OPENROUTER_API_KEY="your_api_key"

# 运行服务器
python -m mcp_openvision

# 使用 MCP Inspector 测试
npx @modelcontextprotocol/inspector uvx mcp-openvision

许可证

该项目遵循 MIT 开源许可条款，请参阅 MIT 了解完整条款。