MCP Browser Operator

MCP Browser Operator

2025.03.27 2

Python浏览器自动化网页测试网页抓取浏览器自动化

MCP Browser Operator 是一个基于 Model Control Protocol (MCP) 的服务，专门用于浏览器自动化。它允许大型语言模型 (LLMs) 通过标准化的 JSON-RPC 接口控制网页浏览器、与网页交互并分析网页内容。该服务提供了浏览器管理、任务管理、网页交互、浏览器工具访问以及网页审计等功能，适用于需要自动化浏览器操作的场景。

View on GitHub

Overview

基本能力

产品定位

MCP Browser Operator 是一个用于浏览器自动化的 MCP 服务器，通过 JSON-RPC 接口实现 LLMs 对浏览器的控制。

核心功能

浏览器管理：创建、导航、操作和关闭浏览器实例
任务管理：通过任务 ID 跟踪浏览器操作状态
网页交互：使用 OpenAI 的 Computer Use API 执行自然语言指令
浏览器工具：访问控制台日志、网络活动、截图等
审计功能：运行可访问性、性能、SEO 等网页审计

适用场景

自动化网页测试
网页内容抓取与分析
自动化网页操作（如填写表单、点击按钮等）
网页性能与 SEO 审计

工具列表

run-server：运行 MCP 服务器的主入口点
run-tests：运行单元和集成测试
run-test-harness：与 MCP Inspector 一起运行以进行交互式测试

常见问题解答

如何设置 OpenAI API 密钥？ 通过环境变量 OPENAI_API_KEY 设置。
如何调试 MCP 服务器？ 使用 --debug 参数运行 run-server 或使用 MCP Inspector。

使用教程

使用依赖

Python 3.11+
Playwright
OpenAI API key

安装教程

克隆仓库： bash git clone https://github.com/yourusername/operator-mcp.git cd operator-mcp
安装依赖： bash pip install -e .
安装 Playwright 浏览器： bash playwright install chromium
设置 OpenAI API 密钥： bash export OPENAI_API_KEY=your-api-key

调试方式

启动 MCP 服务器： bash ./run-server
使用调试模式： bash ./run-server --debug
使用 MCP Inspector 进行交互式测试： bash ./run-test-harness

许可证

None