macOS Screen View & Control MCP Server

macOS Screen View & Control MCP Server

site icon
2025.04.06 1
Python屏幕截图窗口控制键盘模拟开发效率
macOS Screen View & Control MCP Server 是一个模型上下文协议服务器,提供窗口截图功能。该服务器使LLMs能够通过窗口标题或窗口ID捕获macOS上特定窗口的屏幕截图。此外,它还支持列出所有可见窗口、通过标题或所有者名称查找窗口、向活动窗口发送键盘按键事件以及输入文本序列等功能。
View on GitHub

Overview

基本能力

产品定位

macOS Screen View & Control MCP Server 是一个专为macOS设计的屏幕视图和控制工具,旨在通过MCP协议提供窗口截图和键盘控制功能。

核心功能

  • capture_window_screenshot: 通过窗口标题或ID捕获特定窗口的屏幕截图
  • list_windows: 列出所有可见窗口
  • find_window: 通过标题或所有者名称查找窗口
  • send_key: 向活动窗口发送键盘按键事件
  • type_text: 输入文本序列

适用场景

  1. 自动化测试:自动捕获应用窗口截图进行验证
  2. 远程协助:帮助用户解决macOS上的问题
  3. 工作流自动化:通过键盘控制简化重复性任务
  4. 教学演示:记录操作步骤和结果

工具列表

  1. capture_window_screenshot: 捕获窗口截图,支持二进制或base64格式输出
  2. list_windows: 获取当前所有可见窗口列表
  3. find_window: 根据标题或所有者名称查找特定窗口
  4. send_key: 模拟键盘按键,支持组合键
  5. type_text: 模拟文本输入,可设置按键间隔

常见问题解答

  1. 支持哪些按键?
  2. 字母a-z(不区分大小写)
  3. 数字0-9
  4. 特殊键:return, tab, space, delete, escape
  5. 方向键:up_arrow, down_arrow, left_arrow, right_arrow
  6. 修饰键:command, shift, control, option等

使用教程

使用依赖

需要安装Python环境和pip包管理工具

安装教程

pip install git+ssh://[email protected]/jhead/macos-screen-mcp.git

安装完成后运行:

python -m macos_screen_mcp

配置

在Claude或Cursor设置中添加:

"mcpServers": {
 "macos-screen": {
    "name": "macos-screen",
    "url": "http://localhost:8000/sse",
    "description": "MCP server for capturing window screenshots",
    "version": "1.0.0"
  }
}

调试方式

使用MCP检查器调试服务器:

npx @modelcontextprotocol/inspector python -m macos_screen_mcp

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。