MCP Server for CVDLT(Computer Vision & Deep Learning Tools)

Overview

基本能力

产品定位

MCP Server for CVDLT 是一个专为计算机视觉和深度学习任务设计的服务器，提供图像处理和分析功能。

核心功能

使用 YOLOv10 进行图像目标检测
使用 YOLOv8 进行图像分割
使用 Ultralytics SAM 进行整图分割
使用 YOLOv8 进行人体姿态估计
支持本地和网络图像输入
集成 MCP 工具以支持客户端交互
支持 Stdio 和 SSE 传输协议

适用场景

图像目标检测
图像分割
人体姿态估计
计算机视觉研究
深度学习模型测试

工具列表

detect_objects: 使用 YOLOv10 检测图像中的目标
segment_objects: 使用 YOLOv8 分割图像中的目标
segment_image: 使用 Ultralytics SAM 分割整张图像
estimate_pose: 使用 YOLOv8 估计图像中的人体姿态

常见问题解答

模型文件下载: 需要下载 yolov10b.pt, yolov8n-seg.pt, yolov8n-pose.pt, 和 sam_b.pt 到 ./checkpoints 目录
传输协议: 支持 Stdio 和 SSE 模式

使用教程

使用依赖

uv sync
uv sync --index https://pypi.tuna.tsinghua.edu.cn/simple --extra-index-url https://pypi.org/simple
uv pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

安装教程

Stdio 模式:

bash python server.py

SSE 模式:

bash python server.py sse 8080

调试方式

确保模型文件已正确下载并放置在 ./checkpoints 目录
检查服务器是否成功启动并监听指定端口（SSE 模式）
使用客户端工具测试 API 功能

API

Resources

image://system: 图像处理操作接口

Tools

detect_objects: 检测图像中的目标
segment_objects: 分割图像中的目标
segment_image: 分割整张图像
estimate_pose: 估计图像中的人体姿态

许可证

该项目遵循 GPL-3.0 开源许可条款，请参阅 GPL-3.0 了解完整条款。