
Cloudflare Browser Rendering Experiments & MCP Server

2025.03.13
4
TypeScript网页内容提取LLM上下文增强浏览器自动化浏览器自动化内容生成
Cloudflare Browser Rendering Experiments & MCP Server 是一个利用Cloudflare浏览器渲染技术提取网页内容作为LLM上下文的项目。它包含REST API和Workers Binding API的实验,以及一个MCP服务器实现,可用于为LLM提供网页上下文。
View on GitHub
Overview
基本能力
产品定位
该项目旨在通过Cloudflare的浏览器渲染技术,提取和处理网页内容,为大型语言模型(LLM)提供丰富的上下文信息。
核心功能
- 网页内容提取:使用Cloudflare Browser Rendering技术抓取和处理网页内容。
- REST API和Workers Binding API实验:展示如何通过不同API与浏览器渲染交互。
- MCP服务器:提供工具集,用于为LLM获取和处理网页内容。
适用场景
- LLM上下文增强:为LLM提供实时网页内容作为上下文。
- 网页内容自动化处理:自动抓取和处理网页内容。
- 文档搜索和摘要:搜索文档并生成摘要。
工具列表
fetch_page
- 抓取并处理网页内容供LLM使用。search_documentation
- 搜索Cloudflare文档并返回相关内容。extract_structured_content
- 使用CSS选择器从网页提取结构化内容。summarize_content
- 摘要网页内容供LLM使用。
常见问题解答
- 浏览器渲染绑定:需要使用
@cloudflare/puppeteer
包与浏览器绑定交互。 - 资源管理:使用后需关闭浏览器以避免资源泄漏。
- 部署要求:部署Worker时需要启用
nodejs_compat
兼容性标志。
使用教程
使用依赖
- Node.js (v16或更高版本)
- 启用了Browser Rendering的Cloudflare账户
- TypeScript
- Wrangler CLI (用于部署Worker)
安装教程
- 克隆仓库:
git clone https://github.com/yourusername/cloudflare-browser-rendering.git
cd cloudflare-browser-rendering
- 安装依赖:
npm install
- 安装Cloudflare Puppeteer包:
npm install @cloudflare/puppeteer
调试方式
- 部署Worker:
npx wrangler deploy
- 测试Worker:
node test-puppeteer.js
- 运行实验:
npm run experiment:rest
npm run experiment:puppeteer
npm run experiment:content
- 运行MCP服务器:
npm start
# 或开发模式
npm run dev