Steel Puppeteer

Steel Puppeteer

site icon
2024.12.05 0
JavaScript浏览器自动化网页交互网页截图浏览器自动化
Steel Puppeteer 是一个基于 Model Context Protocol 的服务,提供浏览器自动化能力。它结合了 Puppeteer 和 Steel 技术,使 LLMs 能够与网页交互、截图以及在真实浏览器环境中执行 JavaScript。
View on GitHub

Overview

基本能力

产品定位

Steel Puppeteer 是一个浏览器自动化服务,专为需要与网页交互的应用程序设计,特别是那些需要模拟用户行为的场景。

核心功能

  • 浏览器自动化:使用 Puppeteer 进行网页导航、点击、表单填写等操作
  • 截图功能:捕获整个页面或特定元素的截图
  • JavaScript 执行:在浏览器控制台中执行自定义脚本
  • 内容提取:从网页中提取特定元素或整个页面的内容
  • 滚动支持:支持触发懒加载内容的滚动操作
  • 会话管理:通过 Steel 进行浏览器会话管理

适用场景

  • 网页自动化测试
  • 网页内容抓取
  • 网页截图服务
  • 需要与网页交互的 AI 应用
  • 需要模拟用户行为的应用

工具列表

  1. puppeteer_navigate:导航到指定 URL
  2. puppeteer_screenshot:捕获页面或元素截图
  3. puppeteer_click:点击页面元素
  4. puppeteer_fill:填写输入字段
  5. puppeteer_select:选择 SELECT 元素
  6. puppeteer_hover:悬停在元素上
  7. puppeteer_evaluate:执行 JavaScript
  8. puppeteer_get_content:提取页面内容
  9. puppeteer_scroll:滚动页面

常见问题解答

  • Puppeteer 相关问题可参考官方故障排除指南
  • Steel 云服务需要有效的 API 密钥
  • 本地 Steel 实例需要确保运行正常

使用教程

使用依赖

  1. 确保已安装 Node.js
  2. 确保系统满足 Puppeteer 的依赖要求

安装教程

  1. 安装依赖:
npm install
  1. 构建项目:
npm run build
  1. 启动服务:
npm start

调试方式

  1. 检查服务是否在默认端口(3000)上运行
  2. 验证 Puppeteer 是否正确安装
  3. 检查 Steel 实例是否可访问
  4. 查看控制台日志获取错误信息

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。