MCP Browser Operator

MCP Browser Operator

site icon
2025.03.27 2
Python浏览器自动化网页测试网页抓取浏览器自动化
MCP Browser Operator 是一个基于 Model Control Protocol (MCP) 的服务,专门用于浏览器自动化。它允许大型语言模型 (LLMs) 通过标准化的 JSON-RPC 接口控制网页浏览器、与网页交互并分析网页内容。该服务提供了浏览器管理、任务管理、网页交互、浏览器工具访问以及网页审计等功能,适用于需要自动化浏览器操作的场景。
View on GitHub

Overview

基本能力

产品定位

MCP Browser Operator 是一个用于浏览器自动化的 MCP 服务器,通过 JSON-RPC 接口实现 LLMs 对浏览器的控制。

核心功能

  • 浏览器管理:创建、导航、操作和关闭浏览器实例
  • 任务管理:通过任务 ID 跟踪浏览器操作状态
  • 网页交互:使用 OpenAI 的 Computer Use API 执行自然语言指令
  • 浏览器工具:访问控制台日志、网络活动、截图等
  • 审计功能:运行可访问性、性能、SEO 等网页审计

适用场景

  • 自动化网页测试
  • 网页内容抓取与分析
  • 自动化网页操作(如填写表单、点击按钮等)
  • 网页性能与 SEO 审计

工具列表

  • run-server:运行 MCP 服务器的主入口点
  • run-tests:运行单元和集成测试
  • run-test-harness:与 MCP Inspector 一起运行以进行交互式测试

常见问题解答

  • 如何设置 OpenAI API 密钥? 通过环境变量 OPENAI_API_KEY 设置。
  • 如何调试 MCP 服务器? 使用 --debug 参数运行 run-server 或使用 MCP Inspector。

使用教程

使用依赖

  • Python 3.11+
  • Playwright
  • OpenAI API key

安装教程

  1. 克隆仓库: bash git clone https://github.com/yourusername/operator-mcp.git cd operator-mcp
  2. 安装依赖: bash pip install -e .
  3. 安装 Playwright 浏览器: bash playwright install chromium
  4. 设置 OpenAI API 密钥: bash export OPENAI_API_KEY=your-api-key

调试方式

  1. 启动 MCP 服务器: bash ./run-server
  2. 使用调试模式: bash ./run-server --debug
  3. 使用 MCP Inspector 进行交互式测试: bash ./run-test-harness

许可证

None