
MCP OpenVision

2025.04.01
4
Python图像分析AI视觉内容生成
MCP OpenVision 是一个基于 Model Context Protocol (MCP) 的服务,专注于提供图像分析能力。它利用 OpenRouter 的视觉模型,为 AI 助手提供简单的图像分析接口。该服务支持多种图像输入方式,包括 Base64 编码、URL 和本地文件路径,并能根据用户提供的查询进行详细的图像分析。
View on GitHub
Overview
基本能力
产品定位
MCP OpenVision 是一个图像分析服务,旨在通过 AI 视觉模型帮助用户理解和分析图像内容。
核心功能
- 图像分析:支持多种图像输入方式(Base64、URL、本地文件路径)
- 自定义查询:用户可提供详细的查询指令,指导模型进行特定分析
- 多模型支持:兼容 OpenRouter 上的多种视觉模型
- 参数定制:可调整温度、最大令牌数等模型参数
适用场景
- 零售产品识别与价格估算
- 医学图像分析
- 图表数据提取
- 文本转录(如菜单、文档等)
- 艺术分析
工具列表
- image_analysis:核心图像分析工具,支持多种输入格式和详细查询
常见问题解答
- 需要 OpenRouter API 密钥才能使用
- 支持相对路径和绝对路径的图像输入
- 可通过环境变量配置默认模型
使用教程
使用依赖
需要 Python 环境和 OpenRouter API 密钥
安装教程
# 通过 pip 安装
pip install mcp-openvision
# 通过 UV 安装(推荐)
uv pip install mcp-openvision
# 通过 Smithery 安装
npx -y @smithery/cli install @Nazruden/mcp-openvision --client claude
调试方式
# 设置 API 密钥
export OPENROUTER_API_KEY="your_api_key"
# 运行服务器
python -m mcp_openvision
# 使用 MCP Inspector 测试
npx @modelcontextprotocol/inspector uvx mcp-openvision