
macOS Screen View & Control MCP Server

2025.04.06
1
Python屏幕截图窗口控制键盘模拟开发效率
macOS Screen View & Control MCP Server 是一个模型上下文协议服务器,提供窗口截图功能。该服务器使LLMs能够通过窗口标题或窗口ID捕获macOS上特定窗口的屏幕截图。此外,它还支持列出所有可见窗口、通过标题或所有者名称查找窗口、向活动窗口发送键盘按键事件以及输入文本序列等功能。
View on GitHub
Overview
基本能力
产品定位
macOS Screen View & Control MCP Server 是一个专为macOS设计的屏幕视图和控制工具,旨在通过MCP协议提供窗口截图和键盘控制功能。
核心功能
capture_window_screenshot
: 通过窗口标题或ID捕获特定窗口的屏幕截图list_windows
: 列出所有可见窗口find_window
: 通过标题或所有者名称查找窗口send_key
: 向活动窗口发送键盘按键事件type_text
: 输入文本序列
适用场景
- 自动化测试:自动捕获应用窗口截图进行验证
- 远程协助:帮助用户解决macOS上的问题
- 工作流自动化:通过键盘控制简化重复性任务
- 教学演示:记录操作步骤和结果
工具列表
capture_window_screenshot
: 捕获窗口截图,支持二进制或base64格式输出list_windows
: 获取当前所有可见窗口列表find_window
: 根据标题或所有者名称查找特定窗口send_key
: 模拟键盘按键,支持组合键type_text
: 模拟文本输入,可设置按键间隔
常见问题解答
- 支持哪些按键?
- 字母a-z(不区分大小写)
- 数字0-9
- 特殊键:return, tab, space, delete, escape
- 方向键:up_arrow, down_arrow, left_arrow, right_arrow
- 修饰键:command, shift, control, option等
使用教程
使用依赖
需要安装Python环境和pip包管理工具
安装教程
pip install git+ssh://[email protected]/jhead/macos-screen-mcp.git
安装完成后运行:
python -m macos_screen_mcp
配置
在Claude或Cursor设置中添加:
"mcpServers": {
"macos-screen": {
"name": "macos-screen",
"url": "http://localhost:8000/sse",
"description": "MCP server for capturing window screenshots",
"version": "1.0.0"
}
}
调试方式
使用MCP检查器调试服务器:
npx @modelcontextprotocol/inspector python -m macos_screen_mcp