
Browser Use Server

2025.02.01
17
Python浏览器自动化网页开发数据抓取浏览器自动化
cline-browser-use-mcp 是一个基于 Model Context Protocol (MCP) 的服务,专门用于通过 Python 脚本实现浏览器自动化。该服务与 Cline 配合使用,提供了一系列浏览器操作功能,如截图、获取 HTML 内容、执行 JavaScript 和获取控制台日志等。
View on GitHub
Overview
基本能力
产品定位
cline-browser-use-mcp 是一个浏览器自动化工具,旨在通过 MCP 协议提供高效的浏览器操作能力,适用于需要自动化网页交互的场景。
核心功能
- 浏览器操作
screenshot
: 捕获网页的截图(全页或视口)get_html
: 获取网页的 HTML 内容execute_js
: 在网页上执行 JavaScriptget_console_logs
: 获取网页的控制台日志
所有操作都支持在页面加载后执行自定义交互步骤(如点击元素、滚动等)。
适用场景
- 网页开发与测试:自动化测试网页功能和布局。
- 数据抓取:获取网页内容或执行脚本以提取数据。
- 自动化任务:执行需要浏览器交互的重复性任务。
工具列表
- Xvfb:用于无头浏览器自动化的虚拟显示缓冲区。
- Miniconda/Anaconda:用于创建和管理 Python 环境。
- Smithery:用于自动安装和配置服务。
常见问题解答
- 如何设置 API 密钥?
- 通过环境变量设置至少一个 API 密钥(如
GLHF_API_KEY
、GROQ_API_KEY
等)。 - 如何启用视觉支持?
- 设置
USE_VISION=true
环境变量以启用视觉功能。 - 如何调试?
- 使用
npm run inspector
命令进行调试。
使用教程
使用依赖
- 安装 Xvfb(推荐): ```bash # Ubuntu/Debian sudo apt-get install xvfb
# CentOS/RHEL sudo yum install xorg-x11-server-Xvfb
# Arch Linux
sudo pacman -S xorg-server-xvfb
2. 安装 Miniconda 或 Anaconda。
3. 创建 Conda 环境:
bash
conda create -n browser-use python=3.11
conda activate browser-use
pip install browser-use
4. 设置 LLM 配置:
bash
export GLHF_API_KEY=your_api_key
export GROQ_API_KEY=your_api_key
export OPENAI_API_KEY=your_api_key
export OPENROUTER_API_KEY=your_api_key
export GITHUB_API_KEY=your_api_key
export DEEPSEEK_API_KEY=your_api_key
export GEMINI_API_KEY=your_api_key
export OLLAMA_API_KEY=your_api_key
```
安装教程
- 通过 Smithery 安装:
bash npx -y @smithery/cli install @ztobs/cline-browser-use-mcp --client claude
- 克隆仓库:
bash git clone <repository_url> cd cline-browser-use-mcp
- 安装依赖:
bash npm install
- 构建服务:
bash npm run build
调试方式
- 运行服务:
bash node build/index.js
- 使用 MCP Inspector 调试:
bash npm run inspector