MCP OpenVision

MCP OpenVision

site icon
2025.04.01 4
Python图像分析AI视觉内容生成
MCP OpenVision 是一个基于 Model Context Protocol (MCP) 的服务,专注于提供图像分析能力。它利用 OpenRouter 的视觉模型,为 AI 助手提供简单的图像分析接口。该服务支持多种图像输入方式,包括 Base64 编码、URL 和本地文件路径,并能根据用户提供的查询进行详细的图像分析。
View on GitHub

Overview

基本能力

产品定位

MCP OpenVision 是一个图像分析服务,旨在通过 AI 视觉模型帮助用户理解和分析图像内容。

核心功能

  • 图像分析:支持多种图像输入方式(Base64、URL、本地文件路径)
  • 自定义查询:用户可提供详细的查询指令,指导模型进行特定分析
  • 多模型支持:兼容 OpenRouter 上的多种视觉模型
  • 参数定制:可调整温度、最大令牌数等模型参数

适用场景

  • 零售产品识别与价格估算
  • 医学图像分析
  • 图表数据提取
  • 文本转录(如菜单、文档等)
  • 艺术分析

工具列表

  • image_analysis:核心图像分析工具,支持多种输入格式和详细查询

常见问题解答

  • 需要 OpenRouter API 密钥才能使用
  • 支持相对路径和绝对路径的图像输入
  • 可通过环境变量配置默认模型

使用教程

使用依赖

需要 Python 环境和 OpenRouter API 密钥

安装教程

# 通过 pip 安装
pip install mcp-openvision

# 通过 UV 安装(推荐)
uv pip install mcp-openvision

# 通过 Smithery 安装
npx -y @smithery/cli install @Nazruden/mcp-openvision --client claude

调试方式

# 设置 API 密钥
export OPENROUTER_API_KEY="your_api_key"

# 运行服务器
python -m mcp_openvision

# 使用 MCP Inspector 测试
npx @modelcontextprotocol/inspector uvx mcp-openvision

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。