Computer Control MCP

Computer Control MCP

site icon
2025.04.17 1
Python计算机控制自动化测试OCR浏览器自动化开发效率
Computer Control MCP 是一个提供计算机控制能力的MCP服务器,支持鼠标、键盘控制、OCR(光学字符识别)等功能。它使用PyAutoGUI、RapidOCR和ONNXRuntime等技术实现,无需外部依赖。该服务适用于自动化测试、屏幕操作自动化、文本提取等多种场景。
View on GitHub

Overview

基本能力

产品定位

Computer Control MCP 是一个专注于计算机自动化控制的工具,旨在通过编程方式模拟用户操作,如鼠标移动、键盘输入、屏幕截图和OCR文本提取等。

核心功能

  • 鼠标控制:包括点击、移动和拖拽操作。
  • 键盘控制:支持文本输入和按键模拟。
  • 屏幕和窗口管理:截图、获取屏幕分辨率、列出和激活窗口。
  • OCR功能:从截图中提取文本。

适用场景

  • 自动化测试
  • 屏幕操作自动化
  • 文本提取和处理
  • 窗口管理和操作

工具列表

  • 鼠标控制工具click_screen, move_mouse, drag_mouse
  • 键盘控制工具type_text, press_key
  • 屏幕和窗口管理工具take_screenshot, get_screen_size, list_windows, activate_window

常见问题解答

  • 兼容性:主要在Windows上测试,但理论上支持其他平台。
  • 依赖:无需外部依赖。

使用教程

使用依赖

无特殊依赖,直接安装即可。

安装教程

  1. 使用pip安装:
pip install computer-control-mcp
  1. 运行服务:
computer-control-mcp

调试方式

  1. 克隆仓库并进入开发模式:
git clone https://github.com/AB498/computer-control-mcp.git
cd computer-control-mcp
pip install -e .
  1. 运行测试:
python -m pytest

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。