Steel Puppeteer

Steel Puppeteer

2024.12.05 0

JavaScript浏览器自动化网页交互网页截图浏览器自动化

Steel Puppeteer 是一个基于 Model Context Protocol 的服务，提供浏览器自动化能力。它结合了 Puppeteer 和 Steel 技术，使 LLMs 能够与网页交互、截图以及在真实浏览器环境中执行 JavaScript。

View on GitHub

Overview

基本能力

产品定位

Steel Puppeteer 是一个浏览器自动化服务，专为需要与网页交互的应用程序设计，特别是那些需要模拟用户行为的场景。

核心功能

浏览器自动化：使用 Puppeteer 进行网页导航、点击、表单填写等操作
截图功能：捕获整个页面或特定元素的截图
JavaScript 执行：在浏览器控制台中执行自定义脚本
内容提取：从网页中提取特定元素或整个页面的内容
滚动支持：支持触发懒加载内容的滚动操作
会话管理：通过 Steel 进行浏览器会话管理

适用场景

网页自动化测试
网页内容抓取
网页截图服务
需要与网页交互的 AI 应用
需要模拟用户行为的应用

工具列表

puppeteer_navigate：导航到指定 URL
puppeteer_screenshot：捕获页面或元素截图
puppeteer_click：点击页面元素
puppeteer_fill：填写输入字段
puppeteer_select：选择 SELECT 元素
puppeteer_hover：悬停在元素上
puppeteer_evaluate：执行 JavaScript
puppeteer_get_content：提取页面内容
puppeteer_scroll：滚动页面

常见问题解答

Puppeteer 相关问题可参考官方故障排除指南
Steel 云服务需要有效的 API 密钥
本地 Steel 实例需要确保运行正常

使用教程

使用依赖

确保已安装 Node.js
确保系统满足 Puppeteer 的依赖要求

安装教程

安装依赖:

npm install

构建项目:

npm run build

启动服务:

npm start

调试方式

检查服务是否在默认端口(3000)上运行
验证 Puppeteer 是否正确安装
检查 Steel 实例是否可访问
查看控制台日志获取错误信息

许可证

该项目遵循 MIT 开源许可条款，请参阅 MIT 了解完整条款。