PyMCPAutoGUI 🖱️⌨️🖼️ - GUI Automation via MCP

PyMCPAutoGUI 🖱️⌨️🖼️ - GUI Automation via MCP

site icon
2025.03.30 3
PythonGUI 自动化AI 代理工具浏览器自动化开发效率
PyMCPAutoGUI 是一个通过 MCP(Model Context Protocol)实现 GUI 自动化的工具,旨在为 AI 代理提供与计算机图形用户界面(GUI)交互的能力。它允许 AI 代理像人类用户一样控制鼠标、键盘,并与窗口进行交互,适用于自动化重复任务、GUI 测试和构建强大的 AI 助手。
View on GitHub

Overview

基本能力

产品定位

PyMCPAutoGUI 是一个 GUI 自动化工具,通过 MCP 协议为 AI 代理提供与桌面应用程序交互的能力。

核心功能

  • 鼠标控制:移动、点击、拖动、滚动等。
  • 键盘控制:输入文本、按键、组合键等。
  • 屏幕截图:捕获屏幕图像并定位图像。
  • 窗口管理:控制窗口位置、大小、状态(最小化、最大化等)。
  • 用户交互:显示警告、确认和提示框。

适用场景

  • 自动化重复的 GUI 任务。
  • GUI 测试和验证。
  • 构建 AI 助手,实现与桌面应用程序的交互。

工具列表

  • 鼠标工具move_to, click, drag_to, scroll 等。
  • 键盘工具write, press, hotkey 等。
  • 截图工具screenshot, locate_on_screen 等。
  • 窗口工具get_all_titles, activate_window, minimize_window 等。
  • 对话框工具alert, confirm, prompt 等。

常见问题解答

  • 依赖问题:确保安装 pyautoguipygetwindow 的系统依赖。
  • 连接问题:确保 MCP 客户端配置正确,且服务器正在运行。

使用教程

使用依赖

安装 pyautoguipygetwindow 的系统依赖:

# Linux (Ubuntu/Debian)
sudo apt-get install scrot
# macOS
brew install scrot

安装教程

  1. 创建并激活虚拟环境:
python -m venv .venv
# Windows PowerShell
.venv\Scripts\Activate.ps1
# macOS / Linux bash
source .venv/bin/activate
  1. 安装 PyMCPAutoGUI:
pip install pymcpautogui

调试方式

  1. 启动 MCP 服务器:
python -m pymcpautogui.server
  1. 检查服务器输出:
INFO:     Uvicorn running on http://127.0.0.1:6789 (Press CTRL+C to quit)
  1. 在 MCP 客户端(如 Cursor)中测试命令:
@PyMCPAutoGUI move_to(x=100, y=200)

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。