Browser Use Server

Browser Use Server

site icon
2025.02.01 17
Python浏览器自动化网页开发数据抓取浏览器自动化
cline-browser-use-mcp 是一个基于 Model Context Protocol (MCP) 的服务,专门用于通过 Python 脚本实现浏览器自动化。该服务与 Cline 配合使用,提供了一系列浏览器操作功能,如截图、获取 HTML 内容、执行 JavaScript 和获取控制台日志等。
View on GitHub

Overview

基本能力

产品定位

cline-browser-use-mcp 是一个浏览器自动化工具,旨在通过 MCP 协议提供高效的浏览器操作能力,适用于需要自动化网页交互的场景。

核心功能

  1. 浏览器操作
  2. screenshot: 捕获网页的截图(全页或视口)
  3. get_html: 获取网页的 HTML 内容
  4. execute_js: 在网页上执行 JavaScript
  5. get_console_logs: 获取网页的控制台日志

所有操作都支持在页面加载后执行自定义交互步骤(如点击元素、滚动等)。

适用场景

  1. 网页开发与测试:自动化测试网页功能和布局。
  2. 数据抓取:获取网页内容或执行脚本以提取数据。
  3. 自动化任务:执行需要浏览器交互的重复性任务。

工具列表

  1. Xvfb:用于无头浏览器自动化的虚拟显示缓冲区。
  2. Miniconda/Anaconda:用于创建和管理 Python 环境。
  3. Smithery:用于自动安装和配置服务。

常见问题解答

  1. 如何设置 API 密钥?
  2. 通过环境变量设置至少一个 API 密钥(如 GLHF_API_KEYGROQ_API_KEY 等)。
  3. 如何启用视觉支持?
  4. 设置 USE_VISION=true 环境变量以启用视觉功能。
  5. 如何调试?
  6. 使用 npm run inspector 命令进行调试。

使用教程

使用依赖

  1. 安装 Xvfb(推荐): ```bash # Ubuntu/Debian sudo apt-get install xvfb

# CentOS/RHEL sudo yum install xorg-x11-server-Xvfb

# Arch Linux sudo pacman -S xorg-server-xvfb 2. 安装 Miniconda 或 Anaconda。 3. 创建 Conda 环境:bash conda create -n browser-use python=3.11 conda activate browser-use pip install browser-use 4. 设置 LLM 配置:bash export GLHF_API_KEY=your_api_key export GROQ_API_KEY=your_api_key export OPENAI_API_KEY=your_api_key export OPENROUTER_API_KEY=your_api_key export GITHUB_API_KEY=your_api_key export DEEPSEEK_API_KEY=your_api_key export GEMINI_API_KEY=your_api_key export OLLAMA_API_KEY=your_api_key ```

安装教程

  1. 通过 Smithery 安装: bash npx -y @smithery/cli install @ztobs/cline-browser-use-mcp --client claude
  2. 克隆仓库: bash git clone <repository_url> cd cline-browser-use-mcp
  3. 安装依赖: bash npm install
  4. 构建服务: bash npm run build

调试方式

  1. 运行服务: bash node build/index.js
  2. 使用 MCP Inspector 调试: bash npm run inspector

许可证

该项目遵循 MIT 开源许可条款。