MCP Server for CVDLT(Computer Vision & Deep Learning Tools)

MCP Server for CVDLT(Computer Vision & Deep Learning Tools)

site icon
2025.04.18 1
Python计算机视觉深度学习图像处理开发效率
MCP Server for CVDLT (Computer Vision & Deep Learning Tools) 是一个基于 Ultralytics 和 Model Context Protocol (MCP) Python SDK 的服务器,专注于图像处理任务,包括目标检测、分割和姿态估计。它支持多种 YOLO 模型和 Ultralytics SAM 模型,适用于需要高效图像分析的场景。
View on GitHub

Overview

基本能力

产品定位

MCP Server for CVDLT 是一个专为计算机视觉和深度学习任务设计的服务器,提供图像处理和分析功能。

核心功能

  • 使用 YOLOv10 进行图像目标检测
  • 使用 YOLOv8 进行图像分割
  • 使用 Ultralytics SAM 进行整图分割
  • 使用 YOLOv8 进行人体姿态估计
  • 支持本地和网络图像输入
  • 集成 MCP 工具以支持客户端交互
  • 支持 Stdio 和 SSE 传输协议

适用场景

  • 图像目标检测
  • 图像分割
  • 人体姿态估计
  • 计算机视觉研究
  • 深度学习模型测试

工具列表

  • detect_objects: 使用 YOLOv10 检测图像中的目标
  • segment_objects: 使用 YOLOv8 分割图像中的目标
  • segment_image: 使用 Ultralytics SAM 分割整张图像
  • estimate_pose: 使用 YOLOv8 估计图像中的人体姿态

常见问题解答

  • 模型文件下载: 需要下载 yolov10b.pt, yolov8n-seg.pt, yolov8n-pose.pt, 和 sam_b.pt./checkpoints 目录
  • 传输协议: 支持 Stdio 和 SSE 模式

使用教程

使用依赖

uv sync
uv sync --index https://pypi.tuna.tsinghua.edu.cn/simple --extra-index-url https://pypi.org/simple
uv pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

安装教程

  1. Stdio 模式:

bash python server.py

  1. SSE 模式:

bash python server.py sse 8080

调试方式

  • 确保模型文件已正确下载并放置在 ./checkpoints 目录
  • 检查服务器是否成功启动并监听指定端口(SSE 模式)
  • 使用客户端工具测试 API 功能

API

Resources

  • image://system: 图像处理操作接口

Tools

  • detect_objects: 检测图像中的目标
  • segment_objects: 分割图像中的目标
  • segment_image: 分割整张图像
  • estimate_pose: 估计图像中的人体姿态

许可证

该项目遵循 GPL-3.0 开源许可条款,请参阅 GPL-3.0 了解完整条款。