Selenium MCP Server

Selenium MCP Server

site icon
2025.04.14 0
TypeScript浏览器自动化浏览器自动化
Selenium MCP Server 是一个基于 Selenium WebDriver 的 MCP 服务器,允许 AI 代理通过 Model Context Protocol 控制浏览器会话。它支持网页抓取、自动化测试和表单填写等任务。
View on GitHub

Overview

基本能力

产品定位

Selenium MCP Server 是一个用于浏览器自动化的 MCP 服务器,通过 Selenium WebDriver 实现与浏览器的交互。

核心功能

  • 提供 Selenium WebDriver 的 MCP 工具接口
  • 支持浏览器导航、元素查找、点击操作、键盘输入等基本浏览器操作
  • 可获取页面源代码
  • 支持与 MCP 主机(如 Cursor、Claude Desktop)集成

适用场景

  • 网页抓取和数据采集
  • 自动化测试
  • 表单自动填写
  • 浏览器操作自动化

工具列表

  • selenium_navigate: 导航到指定 URL
  • selenium_findElement: 使用 CSS 选择器查找页面元素
  • selenium_click: 点击元素
  • selenium_sendKeys: 向元素发送按键输入
  • selenium_getPageSource: 获取当前页面源代码

常见问题解答

  • 确保 WebDriver 已安装并在系统 PATH 中
  • 确保兼容的浏览器已安装
  • 正确处理 WebDriver 错误(如元素未找到)
  • 确保服务器退出时正确关闭 WebDriver

使用教程

使用依赖

  1. Node.js (v18 或更高版本)
  2. npm (v7 或更高版本)
  3. WebDriver 可执行文件(如 ChromeDriver、GeckoDriver)
  4. 兼容的网页浏览器(如 Chrome、Firefox)

安装教程

  1. 克隆仓库:
git clone <your-repo-url> selenium-mcp-server
cd selenium-mcp-server
  1. 安装依赖:
npm install
  1. 配置 WebDriver:
  2. 确保 WebDriver 已安装并在 PATH 中
  3. 根据需要修改 src/seleniumService.ts
  4. 构建服务器:
npm run build
  1. 运行服务器:
npm start

调试方式

  • 使用 MCP Inspector 或标准 Node.js 调试技术
  • 构建命令: npm run build
  • 运行命令: npm start
  • 代码格式化: npm run format
  • 代码检查: npm run lint

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。