Selenium MCP Server

Selenium MCP Server

site icon
2025.04.03 0
TypeScript浏览器自动化网页测试数据抓取浏览器自动化
Selenium MCP Server 是一个基于 Selenium WebDriver 的 MCP 服务器,允许 AI 代理通过 Model Context Protocol 控制浏览器会话。它支持网页抓取、自动化测试和表单填写等任务。
View on GitHub

Overview

基本能力

产品定位

Selenium MCP Server 是一个用于浏览器自动化的工具,通过 MCP 协议提供对 Selenium WebDriver 的控制能力。

核心功能

  • 提供 Selenium WebDriver 的 MCP 工具化接口
  • 支持浏览器导航、元素查找、点击、输入等操作
  • 可获取页面源代码
  • 支持与 Cursor、Claude Desktop 等 MCP 主机集成

适用场景

  • 网页自动化测试
  • 网页数据抓取
  • 表单自动填写
  • 浏览器操作自动化

工具列表

  • selenium_navigate: 导航到指定 URL
  • selenium_findElement: 使用 CSS 选择器查找页面元素
  • selenium_click: 点击元素
  • selenium_sendKeys: 向元素发送按键输入
  • selenium_getPageSource: 获取当前页面源代码

常见问题解答

  • 确保 WebDriver 已正确安装并在 PATH 中
  • 确保浏览器兼容并正确配置
  • 使用 TypeScript 和 Zod 确保类型安全和验证
  • 正确处理 WebDriver 错误

使用教程

使用依赖

  • Node.js (v18 或更高版本)
  • npm (v7 或更高版本)
  • WebDriver 可执行文件(如 ChromeDriver、GeckoDriver)
  • 兼容的网页浏览器(如 Chrome、Firefox)

安装教程

  1. 克隆仓库:
git clone <your-repo-url> selenium-mcp-server
cd selenium-mcp-server
  1. 安装依赖:
npm install
  1. 配置 WebDriver
  2. 构建服务器:
npm run build
  1. 运行服务器:
npm start

调试方式

  • 使用 MCP Inspector 或标准 Node.js 调试技术
  • 确保正确处理 WebDriver 错误
  • 确保服务器正确关闭 WebDriver 会话

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。