
MCP Server for CVDLT(Computer Vision & Deep Learning Tools)

2025.04.18
1
Python计算机视觉深度学习图像处理开发效率
MCP Server for CVDLT (Computer Vision & Deep Learning Tools) 是一个基于 Ultralytics 和 Model Context Protocol (MCP) Python SDK 的服务器,专注于图像处理任务,包括目标检测、分割和姿态估计。它支持多种 YOLO 模型和 Ultralytics SAM 模型,适用于需要高效图像分析的场景。
View on GitHub
Overview
基本能力
产品定位
MCP Server for CVDLT 是一个专为计算机视觉和深度学习任务设计的服务器,提供图像处理和分析功能。
核心功能
- 使用 YOLOv10 进行图像目标检测
- 使用 YOLOv8 进行图像分割
- 使用 Ultralytics SAM 进行整图分割
- 使用 YOLOv8 进行人体姿态估计
- 支持本地和网络图像输入
- 集成 MCP 工具以支持客户端交互
- 支持 Stdio 和 SSE 传输协议
适用场景
- 图像目标检测
- 图像分割
- 人体姿态估计
- 计算机视觉研究
- 深度学习模型测试
工具列表
- detect_objects: 使用 YOLOv10 检测图像中的目标
- segment_objects: 使用 YOLOv8 分割图像中的目标
- segment_image: 使用 Ultralytics SAM 分割整张图像
- estimate_pose: 使用 YOLOv8 估计图像中的人体姿态
常见问题解答
- 模型文件下载: 需要下载
yolov10b.pt
,yolov8n-seg.pt
,yolov8n-pose.pt
, 和sam_b.pt
到./checkpoints
目录 - 传输协议: 支持 Stdio 和 SSE 模式
使用教程
使用依赖
uv sync
uv sync --index https://pypi.tuna.tsinghua.edu.cn/simple --extra-index-url https://pypi.org/simple
uv pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
安装教程
- Stdio 模式:
bash
python server.py
- SSE 模式:
bash
python server.py sse 8080
调试方式
- 确保模型文件已正确下载并放置在
./checkpoints
目录 - 检查服务器是否成功启动并监听指定端口(SSE 模式)
- 使用客户端工具测试 API 功能
API
Resources
image://system
: 图像处理操作接口
Tools
- detect_objects: 检测图像中的目标
- segment_objects: 分割图像中的目标
- segment_image: 分割整张图像
- estimate_pose: 估计图像中的人体姿态