MCP Browser Use

MCP Browser Use

site icon
2025.03.26 3
Python浏览器自动化网页抓取AI代理工具浏览器自动化
MCP Browser Use 是一个基于 Model Context Protocol (MCP) 和 Selenium 的项目,旨在赋能 AI 代理执行网页使用、浏览器自动化、网页抓取和自动化任务。其使命是通过自然语言指令,让 AI 代理在最少人工监督下完成任何网页任务。
View on GitHub

Overview

基本能力

产品定位

MCP Browser Use 是一个浏览器自动化工具,专门为 AI 代理设计,用于执行网页操作和自动化任务。

核心功能

  • 网页元素点击 (click_element)
  • 浏览器会话关闭 (close_browser)
  • 文本输入 (fill_text)
  • 网页导航 (navigate)
  • 页面滚动 (scroll)
  • 键盘按键发送 (send_keys)
  • 新浏览器会话启动 (start_browser)
  • 页面截图 (take_screenshot)

适用场景

  • 网页自动化测试
  • 数据抓取和爬虫
  • 网页内容自动填充
  • 网页操作自动化流程

工具列表

  1. click_element: 点击页面上的元素
  2. close_browser: 关闭浏览器会话
  3. fill_text: 向输入字段输入文本
  4. navigate: 导航到指定URL
  5. scroll: 滚动页面
  6. send_keys: 向浏览器发送键盘按键
  7. start_browser: 启动新的浏览器会话
  8. take_screenshot: 截取当前页面截图

使用教程

使用依赖

  1. 确保已安装Python环境
  2. 创建虚拟环境(推荐)

安装教程

  1. 克隆仓库到本地
  2. 安装依赖(参考requirements.txt
  3. 配置MCP文件(示例配置已提供)

调试方式

  1. 重启Claude检查配置有效性
  2. 查看错误日志
  3. 检查"New Chat"窗口中的锤子图标是否出现

常见问题解答

  • 配置问题:确保MCP配置文件路径正确
  • 依赖问题:检查所有依赖是否已安装
  • 环境问题:推荐使用虚拟环境

许可证

该项目遵循 Apache-2.0 开源许可条款,请参阅 Apache-2.0 了解完整条款。