
mcp-pyautogui-server

2025.04.02
10
Python自动化测试GUI 自动化屏幕图像识别浏览器自动化开发效率
mcp-pyautogui-server 是一个基于 MCP (Model Context Protocol) 的服务,通过 PyAutoGUI 提供自动化 GUI 测试和控制能力。该服务支持跨平台操作(Windows、macOS、Linux),能够模拟鼠标和键盘操作,进行屏幕截图和图像识别等功能。
View on GitHub
Overview
基本能力
产品定位
mcp-pyautogui-server 是一个自动化 GUI 测试和控制工具,主要用于模拟用户界面操作,适用于自动化测试、GUI 自动化脚本编写等场景。
核心功能
- 鼠标控制:移动鼠标到指定坐标、点击、拖放操作、获取当前鼠标位置
- 键盘控制:输入文本、按下单个按键、组合快捷键
- 屏幕操作:截图、获取屏幕尺寸、在屏幕上查找图像位置、获取像素颜色
适用场景
- 自动化测试
- GUI 自动化脚本编写
- 屏幕图像识别
- 跨平台 GUI 操作模拟
工具列表
- Mouse Control:控制鼠标移动和点击
- Keyboard Control:模拟键盘输入
- Screen Operations:屏幕截图和图像识别
常见问题解答
- 安装依赖:确保 Python 3.12+ 和 PyAutoGUI 已安装
- 调试:使用 MCP Inspector 进行调试
使用教程
使用依赖
- Python 3.12+
- PyAutoGUI
安装教程
pip install mcp-pyautogui-server
调试方式
npx @modelcontextprotocol/inspector uv --directory /path/to/mcp-pyautogui-server run mcp-pyautogui-server