
MCP Browser Operator

2025.03.27
2
Python浏览器自动化网页测试网页抓取浏览器自动化
MCP Browser Operator 是一个基于 Model Control Protocol (MCP) 的服务,专门用于浏览器自动化。它允许大型语言模型 (LLMs) 通过标准化的 JSON-RPC 接口控制网页浏览器、与网页交互并分析网页内容。该服务提供了浏览器管理、任务管理、网页交互、浏览器工具访问以及网页审计等功能,适用于需要自动化浏览器操作的场景。
View on GitHub
Overview
基本能力
产品定位
MCP Browser Operator 是一个用于浏览器自动化的 MCP 服务器,通过 JSON-RPC 接口实现 LLMs 对浏览器的控制。
核心功能
- 浏览器管理:创建、导航、操作和关闭浏览器实例
- 任务管理:通过任务 ID 跟踪浏览器操作状态
- 网页交互:使用 OpenAI 的 Computer Use API 执行自然语言指令
- 浏览器工具:访问控制台日志、网络活动、截图等
- 审计功能:运行可访问性、性能、SEO 等网页审计
适用场景
- 自动化网页测试
- 网页内容抓取与分析
- 自动化网页操作(如填写表单、点击按钮等)
- 网页性能与 SEO 审计
工具列表
run-server
:运行 MCP 服务器的主入口点run-tests
:运行单元和集成测试run-test-harness
:与 MCP Inspector 一起运行以进行交互式测试
常见问题解答
- 如何设置 OpenAI API 密钥?
通过环境变量
OPENAI_API_KEY
设置。 - 如何调试 MCP 服务器?
使用
--debug
参数运行run-server
或使用 MCP Inspector。
使用教程
使用依赖
- Python 3.11+
- Playwright
- OpenAI API key
安装教程
- 克隆仓库:
bash git clone https://github.com/yourusername/operator-mcp.git cd operator-mcp
- 安装依赖:
bash pip install -e .
- 安装 Playwright 浏览器:
bash playwright install chromium
- 设置 OpenAI API 密钥:
bash export OPENAI_API_KEY=your-api-key
调试方式
- 启动 MCP 服务器:
bash ./run-server
- 使用调试模式:
bash ./run-server --debug
- 使用 MCP Inspector 进行交互式测试:
bash ./run-test-harness
许可证
None