🔍 Prysm MCP Server

🔍 Prysm MCP Server

site icon
2025.04.05 1
TypeScript网页抓取内容提取浏览器自动化
Prysm MCP Server 是一个基于 Model Context Protocol (MCP) 的网页内容抓取服务,专为 AI 助手(如 Claude 等)设计,提供高精度和灵活的网页内容抓取能力。
View on GitHub

Overview

基本能力

产品定位

Prysm MCP Server 是一个网页内容抓取服务,旨在为 AI 助手提供高质量的网页内容抓取功能。

核心功能

  • 多种抓取模式:支持快速(focused)、平衡(balanced)和深度(deep)三种抓取模式
  • 内容分析:智能分析 URL 以确定最佳抓取策略
  • 格式灵活性:支持将结果格式化为 markdown、HTML 或 JSON
  • 图片支持:可选提取和下载图片
  • 智能滚动:可配置滚动行为以适应单页应用
  • 响应式设计:适应不同网站布局和结构
  • 文件输出:可将格式化结果保存到指定目录

适用场景

  • AI 助手需要获取网页内容进行分析
  • 需要从网页中提取结构化数据
  • 需要保存网页内容供后续使用

工具列表

  1. scrapeFocused:快速抓取模式,专注于主要内容
  2. scrapeBalanced:平衡抓取模式,兼顾速度和覆盖率
  3. scrapeDeep:深度抓取模式,获取最全面的内容
  4. formatResult:将抓取的数据格式化为 markdown、HTML 或 JSON

常见问题解答

  • 如何设置输出目录?可以通过环境变量或直接在工具参数中指定
  • 如何配置图片下载路径?通过 PRYSM_IMAGE_OUTPUT_DIR 环境变量或工具参数设置

使用教程

使用依赖

需要安装 Node.js 和 npm

安装教程

# 推荐安装 LLM 优化版本
npm install -g @pinkpixel/prysm-mcp

# 或安装标准版本
npm install -g prysm-mcp

# 或克隆并构建
git clone https://github.com/pinkpixel-dev/prysm-mcp.git
cd prysm-mcp
npm install
npm run build

调试方式

# 本地运行服务器
node bin/prysm-mcp

# 调试 MCP 通信
DEBUG=mcp:* node bin/prysm-mcp

# 设置自定义输出目录
PRYSM_OUTPUT_DIR=./my-output PRYSM_IMAGE_OUTPUT_DIR=./my-output/images node bin/prysm-mcp

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。