
Selenium MCP Server

2025.04.14
0
TypeScript浏览器自动化浏览器自动化
Selenium MCP Server 是一个基于 Selenium WebDriver 的 MCP 服务器,允许 AI 代理通过 Model Context Protocol 控制浏览器会话。它支持网页抓取、自动化测试和表单填写等任务。
View on GitHub
Overview
基本能力
产品定位
Selenium MCP Server 是一个用于浏览器自动化的 MCP 服务器,通过 Selenium WebDriver 实现与浏览器的交互。
核心功能
- 提供 Selenium WebDriver 的 MCP 工具接口
- 支持浏览器导航、元素查找、点击操作、键盘输入等基本浏览器操作
- 可获取页面源代码
- 支持与 MCP 主机(如 Cursor、Claude Desktop)集成
适用场景
- 网页抓取和数据采集
- 自动化测试
- 表单自动填写
- 浏览器操作自动化
工具列表
selenium_navigate
: 导航到指定 URLselenium_findElement
: 使用 CSS 选择器查找页面元素selenium_click
: 点击元素selenium_sendKeys
: 向元素发送按键输入selenium_getPageSource
: 获取当前页面源代码
常见问题解答
- 确保 WebDriver 已安装并在系统 PATH 中
- 确保兼容的浏览器已安装
- 正确处理 WebDriver 错误(如元素未找到)
- 确保服务器退出时正确关闭 WebDriver
使用教程
使用依赖
- Node.js (v18 或更高版本)
- npm (v7 或更高版本)
- WebDriver 可执行文件(如 ChromeDriver、GeckoDriver)
- 兼容的网页浏览器(如 Chrome、Firefox)
安装教程
- 克隆仓库:
git clone <your-repo-url> selenium-mcp-server
cd selenium-mcp-server
- 安装依赖:
npm install
- 配置 WebDriver:
- 确保 WebDriver 已安装并在 PATH 中
- 根据需要修改
src/seleniumService.ts
- 构建服务器:
npm run build
- 运行服务器:
npm start
调试方式
- 使用 MCP Inspector 或标准 Node.js 调试技术
- 构建命令:
npm run build
- 运行命令:
npm start
- 代码格式化:
npm run format
- 代码检查:
npm run lint