Steel Puppeteer

Steel Puppeteer

site icon
2025.02.17 0
JavaScript浏览器自动化网页交互内容抓取浏览器自动化
Steel Puppeteer 是一个基于 Model Context Protocol 的服务,提供浏览器自动化能力。它结合了 Puppeteer 和 Steel 技术,使 LLMs 能够与网页交互、截图以及在真实浏览器环境中执行 JavaScript。
View on GitHub

Overview

基本能力

产品定位

Steel Puppeteer 是一个浏览器自动化服务,主要用于网页交互、内容提取和自动化测试等场景。

核心功能

  • 浏览器自动化(导航、点击、表单填写等)
  • 截图功能(全页或特定元素)
  • JavaScript 执行
  • 内容提取(带令牌限制处理)
  • 懒加载支持(通过滚动触发)
  • 本地和远程 Steel 实例支持
  • 控制台日志监控和捕获

适用场景

  • 网页自动化测试
  • 网页内容抓取
  • 网页截图生成
  • 网页交互模拟
  • 懒加载内容获取

工具列表

  1. puppeteer_navigate:导航到指定 URL
  2. puppeteer_screenshot:捕获页面或元素截图
  3. puppeteer_click:点击页面元素
  4. puppeteer_fill:填写输入字段
  5. puppeteer_select:选择 SELECT 元素
  6. puppeteer_hover:悬停页面元素
  7. puppeteer_evaluate:在浏览器控制台执行 JavaScript
  8. puppeteer_get_content:从当前页面提取内容
  9. puppeteer_scroll:滚动页面触发懒加载

常见问题解答

  • Puppeteer 相关问题:参考 Puppeteer 故障排除指南
  • Steel 云服务问题:确保 API 密钥有效且有权限
  • 本地 Steel 实例问题:确保实例正在运行并可访问

使用教程

使用依赖

  1. 确保已安装 Node.js 和 npm
  2. 确保系统满足 Puppeteer 的依赖要求

安装教程

  1. 安装依赖:
npm install
  1. 构建项目:
npm run build
  1. 启动服务:
npm start

调试方式

  1. 检查服务是否在默认端口(3000)上运行
  2. 查看控制台日志以获取错误信息
  3. 验证环境变量配置是否正确
  4. 使用 Puppeteer 调试工具进行网页交互调试

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。