
Steel Puppeteer

2024.12.05
0
JavaScript浏览器自动化网页交互网页截图浏览器自动化
Steel Puppeteer 是一个基于 Model Context Protocol 的服务,提供浏览器自动化能力。它结合了 Puppeteer 和 Steel 技术,使 LLMs 能够与网页交互、截图以及在真实浏览器环境中执行 JavaScript。
View on GitHub
Overview
基本能力
产品定位
Steel Puppeteer 是一个浏览器自动化服务,专为需要与网页交互的应用程序设计,特别是那些需要模拟用户行为的场景。
核心功能
- 浏览器自动化:使用 Puppeteer 进行网页导航、点击、表单填写等操作
- 截图功能:捕获整个页面或特定元素的截图
- JavaScript 执行:在浏览器控制台中执行自定义脚本
- 内容提取:从网页中提取特定元素或整个页面的内容
- 滚动支持:支持触发懒加载内容的滚动操作
- 会话管理:通过 Steel 进行浏览器会话管理
适用场景
- 网页自动化测试
- 网页内容抓取
- 网页截图服务
- 需要与网页交互的 AI 应用
- 需要模拟用户行为的应用
工具列表
- puppeteer_navigate:导航到指定 URL
- puppeteer_screenshot:捕获页面或元素截图
- puppeteer_click:点击页面元素
- puppeteer_fill:填写输入字段
- puppeteer_select:选择 SELECT 元素
- puppeteer_hover:悬停在元素上
- puppeteer_evaluate:执行 JavaScript
- puppeteer_get_content:提取页面内容
- puppeteer_scroll:滚动页面
常见问题解答
- Puppeteer 相关问题可参考官方故障排除指南
- Steel 云服务需要有效的 API 密钥
- 本地 Steel 实例需要确保运行正常
使用教程
使用依赖
- 确保已安装 Node.js
- 确保系统满足 Puppeteer 的依赖要求
安装教程
- 安装依赖:
npm install
- 构建项目:
npm run build
- 启动服务:
npm start
调试方式
- 检查服务是否在默认端口(3000)上运行
- 验证 Puppeteer 是否正确安装
- 检查 Steel 实例是否可访问
- 查看控制台日志获取错误信息