mcp-pyautogui-server

mcp-pyautogui-server

site icon
2025.04.02 10
Python自动化测试GUI 自动化屏幕图像识别浏览器自动化开发效率
mcp-pyautogui-server 是一个基于 MCP (Model Context Protocol) 的服务,通过 PyAutoGUI 提供自动化 GUI 测试和控制能力。该服务支持跨平台操作(Windows、macOS、Linux),能够模拟鼠标和键盘操作,进行屏幕截图和图像识别等功能。
View on GitHub

Overview

基本能力

产品定位

mcp-pyautogui-server 是一个自动化 GUI 测试和控制工具,主要用于模拟用户界面操作,适用于自动化测试、GUI 自动化脚本编写等场景。

核心功能

  • 鼠标控制:移动鼠标到指定坐标、点击、拖放操作、获取当前鼠标位置
  • 键盘控制:输入文本、按下单个按键、组合快捷键
  • 屏幕操作:截图、获取屏幕尺寸、在屏幕上查找图像位置、获取像素颜色

适用场景

  • 自动化测试
  • GUI 自动化脚本编写
  • 屏幕图像识别
  • 跨平台 GUI 操作模拟

工具列表

  • Mouse Control:控制鼠标移动和点击
  • Keyboard Control:模拟键盘输入
  • Screen Operations:屏幕截图和图像识别

常见问题解答

  • 安装依赖:确保 Python 3.12+ 和 PyAutoGUI 已安装
  • 调试:使用 MCP Inspector 进行调试

使用教程

使用依赖

  • Python 3.12+
  • PyAutoGUI

安装教程

pip install mcp-pyautogui-server

调试方式

npx @modelcontextprotocol/inspector uv --directory /path/to/mcp-pyautogui-server run mcp-pyautogui-server

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。