View Control MCP Server

View Control MCP Server

site icon
2025.03.15 0
TypeScript本地PC操作屏幕捕获AI助手集成浏览器自动化开发效率
View Control MCP Server 是一个基于Model Context Protocol (MCP)的服务器,用于实现本地PC的操作,包括鼠标点击、键盘输入和屏幕捕获等功能。它通过JSON-RPC 2.0协议与AI语言模型应用程序(客户端)进行通信,使得AI助手能够利用这些功能。该服务器支持与Claude Desktop和Cursor等MCP客户端的集成。
View on GitHub

Overview

基本能力

产品定位

View Control MCP Server 是一个用于本地PC操作和屏幕捕获的MCP服务器,旨在通过标准化协议实现AI助手与外部服务的通信。

核心功能

  • 鼠标操作:获取鼠标位置、移动鼠标、点击(左/右/中键)、拖放。
  • 键盘操作:文本输入、按键按下、组合键(Command, Alt, Control, Shift)。
  • 屏幕捕获:捕获整个屏幕,获取Base64编码的图像数据。
  • 通信方式:基于JSON-RPC 2.0的MCP协议,支持Stdio传输(标准输入输出)。

适用场景

  • AI助手通过MCP客户端控制本地PC。
  • 开发者在开发过程中进行自动化测试或屏幕捕获。
  • 与Claude Desktop和Cursor等MCP客户端集成。

工具列表

  • tools/list:获取可用工具列表。
  • tools/call:调用特定工具。
  • mouse.getPosition:获取鼠标位置。
  • mouse.move:移动鼠标。
  • mouse.click:鼠标点击。
  • keyboard.type:文本输入。
  • keyboard.press:按键按下。
  • screen.capture:屏幕捕获。
  • server.info:获取服务器信息。

常见问题解答

  • 安全性:该服务器操作本地PC,需在可信网络中使用。
  • 隐私:屏幕捕获功能需注意隐私保护。

使用教程

使用依赖

确保已安装Node.js和npm。

安装教程

npm install view-control-mcp-server

服务器启动

npx view-control-mcp-server

调试方式

安装MCP Inspector进行调试:

npm install -g @anthropic/mcp-inspector
mcp-inspector

访问http://localhost:5173进行通信测试。

许可证

该项目遵循 MIT 开源许可条款。