
🔍 Prysm MCP Server

2025.04.05
1
TypeScript网页抓取内容提取浏览器自动化
Prysm MCP Server 是一个基于 Model Context Protocol (MCP) 的网页内容抓取服务,专为 AI 助手(如 Claude 等)设计,提供高精度和灵活的网页内容抓取能力。
View on GitHub
Overview
基本能力
产品定位
Prysm MCP Server 是一个网页内容抓取服务,旨在为 AI 助手提供高质量的网页内容抓取功能。
核心功能
- 多种抓取模式:支持快速(focused)、平衡(balanced)和深度(deep)三种抓取模式
- 内容分析:智能分析 URL 以确定最佳抓取策略
- 格式灵活性:支持将结果格式化为 markdown、HTML 或 JSON
- 图片支持:可选提取和下载图片
- 智能滚动:可配置滚动行为以适应单页应用
- 响应式设计:适应不同网站布局和结构
- 文件输出:可将格式化结果保存到指定目录
适用场景
- AI 助手需要获取网页内容进行分析
- 需要从网页中提取结构化数据
- 需要保存网页内容供后续使用
工具列表
- scrapeFocused:快速抓取模式,专注于主要内容
- scrapeBalanced:平衡抓取模式,兼顾速度和覆盖率
- scrapeDeep:深度抓取模式,获取最全面的内容
- formatResult:将抓取的数据格式化为 markdown、HTML 或 JSON
常见问题解答
- 如何设置输出目录?可以通过环境变量或直接在工具参数中指定
- 如何配置图片下载路径?通过 PRYSM_IMAGE_OUTPUT_DIR 环境变量或工具参数设置
使用教程
使用依赖
需要安装 Node.js 和 npm
安装教程
# 推荐安装 LLM 优化版本
npm install -g @pinkpixel/prysm-mcp
# 或安装标准版本
npm install -g prysm-mcp
# 或克隆并构建
git clone https://github.com/pinkpixel-dev/prysm-mcp.git
cd prysm-mcp
npm install
npm run build
调试方式
# 本地运行服务器
node bin/prysm-mcp
# 调试 MCP 通信
DEBUG=mcp:* node bin/prysm-mcp
# 设置自定义输出目录
PRYSM_OUTPUT_DIR=./my-output PRYSM_IMAGE_OUTPUT_DIR=./my-output/images node bin/prysm-mcp