MCP Server for PyAutoGUI

MCP Server for PyAutoGUI

site icon
2025.03.29 3
Python桌面自动化AI 交互浏览器自动化
mcp-pyautogui 是一个基于 Model Context Protocol (MCP) 的服务,专门为 PyAutoGUI 提供支持。它允许用户通过 AI 系统或自定义脚本控制鼠标、键盘和屏幕交互,实现桌面自动化任务。该服务通过 stdio 传输运行,提供点击、打字、截图等功能,适用于开发者和 AI 爱好者。
View on GitHub

Overview

基本能力

产品定位

mcp-pyautogui 是一个桌面自动化工具,通过 MCP 协议提供对 PyAutoGUI 的控制,适用于需要自动化鼠标、键盘和屏幕交互的场景。

核心功能

  • 控制鼠标移动、点击和拖动
  • 模拟键盘输入(单键、文本、快捷键)
  • 捕获屏幕截图和获取鼠标位置
  • 获取当前操作系统信息
  • 一致的错误处理(返回布尔值表示操作是否成功)

适用场景

  • 自动化测试
  • 桌面任务自动化
  • AI 系统与桌面交互
  • 开发效率工具

工具列表

  • click(x, y): 在坐标 (x, y) 处左键点击
  • right_click(x, y): 在坐标 (x, y) 处右键点击
  • move_to(x, y): 在 3 秒内将鼠标移动到坐标 (x, y)
  • drag_to(x, y, duration): 在指定时间内拖动鼠标到 (x, y)
  • type_text(text): 输入指定文本
  • press_key(key): 按下并释放单个键
  • hotkey(keys): 同时按下多个键
  • scroll(amount): 向上或向下滚动指定量
  • take_screenshot(filename): 保存截图到指定文件
  • get_mouse_position(): 获取当前鼠标坐标
  • get_os(): 获取当前操作系统名称
  • double_click(x, y): 在坐标 (x, y) 处双击
  • get_screen_size(): 获取屏幕分辨率
  • pixel_color(x, y): 获取坐标 (x, y) 处的像素颜色

常见问题解答

  • 如何安装? 使用 pip install mcp-pyautogui 安装。
  • 如何配置?claude_desktop_config.json 文件中添加 mcp-pyautogui 的路径和参数。
  • 如何测试? 使用类似 "can you click at (200,200) ?" 的命令测试。

使用教程

使用依赖

  • Python 3.11+
  • 需要授予相关权限

安装教程

pip install mcp-pyautogui

调试方式

运行以下命令确定服务器安装位置:

which mcp-pyautogui

claude_desktop_config.json 文件中配置服务器路径和参数:

{
  "mcpServers": {
    "mcp-pyautogui": {
      "command": "/Users/bob/miniconda3/envs/desk/bin/mcp-pyautogui",
      "args": [
          ""
      ]
    }
  }
}

测试命令示例:

  • 点击 (100, 200): click(100, 200)
  • 输入 "hello": type_text("hello")
  • 截图: take_screenshot("screenshot.png")
  • 获取鼠标位置: get_mouse_position()
  • 复制文本: hotkey("ctrl c")
  • 获取操作系统: get_os()

许可证

该项目遵循 GPL-3.0 开源许可条款,请参阅 GPL-3.0 了解完整条款。