MCP Selenium Server

MCP Selenium Server

site icon
2025.04.12 102
JavaScript浏览器自动化浏览器自动化
MCP Selenium Server 是一个基于 Model Context Protocol (MCP) 的 Selenium WebDriver 实现,通过标准化的 MCP 客户端实现浏览器自动化。它支持多种浏览器操作,包括启动浏览器会话、导航到 URL、查找元素、与元素交互、执行鼠标和键盘操作、截图、上传文件等。
View on GitHub

Overview

基本能力

产品定位

MCP Selenium Server 是一个浏览器自动化工具,通过 MCP 协议提供标准化的浏览器操作接口。

核心功能

  • 启动浏览器会话(支持 Chrome 和 Firefox)
  • 导航到指定 URL
  • 使用多种定位策略查找元素
  • 与元素交互(点击、输入文本等)
  • 执行鼠标操作(悬停、拖放、双击、右键点击)
  • 处理键盘输入
  • 截图功能
  • 文件上传
  • 支持无头模式

适用场景

  • 自动化测试
  • 网页数据抓取
  • 网页内容监控
  • 自动化表单填写
  • 网页交互流程自动化

工具列表

  1. start_browser: 启动浏览器会话
  2. navigate: 导航到指定 URL
  3. find_element: 查找页面元素
  4. click_element: 点击元素
  5. send_keys: 向元素输入文本
  6. get_element_text: 获取元素文本
  7. hover: 鼠标悬停
  8. drag_and_drop: 拖放操作
  9. double_click: 双击元素
  10. right_click: 右键点击
  11. press_key: 模拟按键
  12. upload_file: 上传文件
  13. take_screenshot: 截图
  14. close_session: 关闭会话

常见问题解答

  • 支持 Chrome 和 Firefox 浏览器
  • 可以通过 headless 模式运行
  • 提供多种元素定位策略(id、css、xpath、name、tag、class)

使用教程

使用依赖

需要安装 Node.js 和 npm

安装教程

通过 Smithery 安装

npx -y @smithery/cli install @angiejones/mcp-selenium --client claude

手动安装

npm install -g @angiejones/mcp-selenium

调试方式

启动服务器:

mcp-selenium

或使用 NPX 运行:

npx -y @angiejones/mcp-selenium

配置 MCP 客户端:

{
  "mcpServers": {
    "selenium": {
      "command": "npx",
      "args": [
        "-y",
        "@angiejones/mcp-selenium"
      ]
    }
  }
}

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。