Screenshot MCP Server

Screenshot MCP Server

site icon
2025.03.07 2
Python截图服务AI视觉分析浏览器自动化
Screenshot MCP Server 是一个提供截图功能的MCP服务器,专为AI工具设计,使其能够捕获和处理屏幕内容。该服务器支持全屏截图、自动JPEG压缩以及Base64编码的图像数据传输,适用于需要视觉分析的AI应用场景。
View on GitHub

Overview

基本能力

产品定位

Screenshot MCP Server 是一个为AI工具提供截图功能的服务器,使AI助手能够捕获和分析用户屏幕内容。

核心功能

  • 全屏截图
  • 自动JPEG压缩以提高传输效率
  • Base64编码的图像数据,确保可靠传输
  • 支持stdio和SSE两种传输模式
  • 可配置的图像质量和优化
  • 简单的命令行界面用于测试

适用场景

  • AI视觉分析工具
  • 自动化测试工具
  • 远程协助应用
  • 屏幕内容监控

工具列表

  • take_screenshot: 捕获用户屏幕的截图,并以JPEG格式返回Base64编码的图像数据。

常见问题解答

  • 支持的操作系统: Linux, macOS, Windows
  • 支持的Python版本: 3.10或更高版本(低于3.13)
  • 依赖项: mcp >= 1.0.0, pyautogui >= 0.9.54, Pillow >= 10.0.0

使用教程

使用依赖

确保已安装Python 3.10或更高版本,并安装以下依赖项:

pip install mcp>=1.0.0 pyautogui>=0.9.54 Pillow>=10.0.0

安装教程

从源代码安装:

git clone https://github.com/codingthefuturewithai/screenshot_mcp_server.git
cd screenshot_mcp_server
uv pip install -e .
# 或使用pip
pip install -e .

调试方式

命令行客户端

screenshot_mcp_server-client output.jpg

编程使用

from mcp import ClientSession, StdioServerParameters
from mcp.client.stdio import stdio_client

async with stdio_client(StdioServerParameters(command="screenshot_mcp_server-server")) as (read, write):
    async with ClientSession(read, write) as session:
        result = await session.call_tool("take_screenshot")
        # 处理截图数据...

SSE模式

screenshot_mcp_server-server-sse --port 3001

许可证

该项目遵循 MIT 开源许可条款。