
Computer Control MCP

2025.04.17
1
Python计算机控制自动化测试OCR浏览器自动化开发效率
Computer Control MCP 是一个提供计算机控制能力的MCP服务器,支持鼠标、键盘控制、OCR(光学字符识别)等功能。它使用PyAutoGUI、RapidOCR和ONNXRuntime等技术实现,无需外部依赖。该服务适用于自动化测试、屏幕操作自动化、文本提取等多种场景。
View on GitHub
Overview
基本能力
产品定位
Computer Control MCP 是一个专注于计算机自动化控制的工具,旨在通过编程方式模拟用户操作,如鼠标移动、键盘输入、屏幕截图和OCR文本提取等。
核心功能
- 鼠标控制:包括点击、移动和拖拽操作。
- 键盘控制:支持文本输入和按键模拟。
- 屏幕和窗口管理:截图、获取屏幕分辨率、列出和激活窗口。
- OCR功能:从截图中提取文本。
适用场景
- 自动化测试
- 屏幕操作自动化
- 文本提取和处理
- 窗口管理和操作
工具列表
- 鼠标控制工具:
click_screen
,move_mouse
,drag_mouse
- 键盘控制工具:
type_text
,press_key
- 屏幕和窗口管理工具:
take_screenshot
,get_screen_size
,list_windows
,activate_window
常见问题解答
- 兼容性:主要在Windows上测试,但理论上支持其他平台。
- 依赖:无需外部依赖。
使用教程
使用依赖
无特殊依赖,直接安装即可。
安装教程
- 使用
pip
安装:
pip install computer-control-mcp
- 运行服务:
computer-control-mcp
调试方式
- 克隆仓库并进入开发模式:
git clone https://github.com/AB498/computer-control-mcp.git
cd computer-control-mcp
pip install -e .
- 运行测试:
python -m pytest