
Selenium MCP Server

2025.04.03
0
TypeScript浏览器自动化网页测试数据抓取浏览器自动化
Selenium MCP Server 是一个基于 Selenium WebDriver 的 MCP 服务器,允许 AI 代理通过 Model Context Protocol 控制浏览器会话。它支持网页抓取、自动化测试和表单填写等任务。
View on GitHub
Overview
基本能力
产品定位
Selenium MCP Server 是一个用于浏览器自动化的工具,通过 MCP 协议提供对 Selenium WebDriver 的控制能力。
核心功能
- 提供 Selenium WebDriver 的 MCP 工具化接口
- 支持浏览器导航、元素查找、点击、输入等操作
- 可获取页面源代码
- 支持与 Cursor、Claude Desktop 等 MCP 主机集成
适用场景
- 网页自动化测试
- 网页数据抓取
- 表单自动填写
- 浏览器操作自动化
工具列表
selenium_navigate
: 导航到指定 URLselenium_findElement
: 使用 CSS 选择器查找页面元素selenium_click
: 点击元素selenium_sendKeys
: 向元素发送按键输入selenium_getPageSource
: 获取当前页面源代码
常见问题解答
- 确保 WebDriver 已正确安装并在 PATH 中
- 确保浏览器兼容并正确配置
- 使用 TypeScript 和 Zod 确保类型安全和验证
- 正确处理 WebDriver 错误
使用教程
使用依赖
- Node.js (v18 或更高版本)
- npm (v7 或更高版本)
- WebDriver 可执行文件(如 ChromeDriver、GeckoDriver)
- 兼容的网页浏览器(如 Chrome、Firefox)
安装教程
- 克隆仓库:
git clone <your-repo-url> selenium-mcp-server
cd selenium-mcp-server
- 安装依赖:
npm install
- 配置 WebDriver
- 构建服务器:
npm run build
- 运行服务器:
npm start
调试方式
- 使用 MCP Inspector 或标准 Node.js 调试技术
- 确保正确处理 WebDriver 错误
- 确保服务器正确关闭 WebDriver 会话