
View Control MCP Server

2025.03.15
0
TypeScript本地PC操作屏幕捕获AI助手集成浏览器自动化开发效率
View Control MCP Server 是一个基于Model Context Protocol (MCP)的服务器,用于实现本地PC的操作,包括鼠标点击、键盘输入和屏幕捕获等功能。它通过JSON-RPC 2.0协议与AI语言模型应用程序(客户端)进行通信,使得AI助手能够利用这些功能。该服务器支持与Claude Desktop和Cursor等MCP客户端的集成。
View on GitHub
Overview
基本能力
产品定位
View Control MCP Server 是一个用于本地PC操作和屏幕捕获的MCP服务器,旨在通过标准化协议实现AI助手与外部服务的通信。
核心功能
- 鼠标操作:获取鼠标位置、移动鼠标、点击(左/右/中键)、拖放。
- 键盘操作:文本输入、按键按下、组合键(Command, Alt, Control, Shift)。
- 屏幕捕获:捕获整个屏幕,获取Base64编码的图像数据。
- 通信方式:基于JSON-RPC 2.0的MCP协议,支持Stdio传输(标准输入输出)。
适用场景
- AI助手通过MCP客户端控制本地PC。
- 开发者在开发过程中进行自动化测试或屏幕捕获。
- 与Claude Desktop和Cursor等MCP客户端集成。
工具列表
tools/list
:获取可用工具列表。tools/call
:调用特定工具。mouse.getPosition
:获取鼠标位置。mouse.move
:移动鼠标。mouse.click
:鼠标点击。keyboard.type
:文本输入。keyboard.press
:按键按下。screen.capture
:屏幕捕获。server.info
:获取服务器信息。
常见问题解答
- 安全性:该服务器操作本地PC,需在可信网络中使用。
- 隐私:屏幕捕获功能需注意隐私保护。
使用教程
使用依赖
确保已安装Node.js和npm。
安装教程
npm install view-control-mcp-server
服务器启动
npx view-control-mcp-server
调试方式
安装MCP Inspector进行调试:
npm install -g @anthropic/mcp-inspector
mcp-inspector
访问http://localhost:5173
进行通信测试。