Firecrawl MCP Server

Firecrawl MCP Server

site icon
2025.02.13 2
TypeScript网页抓取内容搜索站点爬取数据提取搜索工具开发效率
Firecrawl MCP Server 是一个基于 Model Context Protocol (MCP) 的服务,专注于网页抓取、内容搜索、站点爬取和数据提取。它利用 Firecrawl API 提供强大的网络内容处理能力,适用于需要从网页中提取结构化数据的各种场景。
View on GitHub

Overview

基本能力

产品定位

Firecrawl MCP Server 是一个专业的网页内容抓取和处理工具,旨在帮助开发者高效地从网页中提取、搜索和处理数据。

核心功能

  • 网页抓取:支持从任何网页提取内容,包括移动设备模拟、广告拦截、内容过滤和结构化数据提取。
  • 内容搜索:提供智能搜索功能,支持多语言和基于位置的结果。
  • 站点爬取:高级爬取功能,包括深度控制、路径过滤和速率限制。
  • 站点地图生成:生成站点结构地图,支持子域和链接分析。
  • 数据提取:从多个 URL 提取结构化数据,支持批量处理和自定义提取提示。

适用场景

  • 数据挖掘和分析
  • 内容聚合和监控
  • 站点结构分析和优化
  • 自动化测试和开发

工具列表

  • npm:用于安装和管理依赖。
  • Firecrawl API:提供网页抓取和数据处理的核心能力。
  • dotenv:用于环境变量管理。

常见问题解答

  • 如何获取 API Key:从 Firecrawl 开发者门户获取。
  • 如何设置环境变量:支持多种操作系统和开发环境。
  • 错误处理:提供详细的错误消息和调试日志。

使用教程

使用依赖

确保已安装 Node.js 和 npm。

安装教程

# 全局安装
npm install -g @modelcontextprotocol/mcp-server-firecrawl

# 本地项目安装
npm install @modelcontextprotocol/mcp-server-firecrawl

调试方式

  1. 设置 API Key: bash export FIRECRAWL_API_KEY=your-api-key
  2. 运行服务器: bash mcp-server-firecrawl
  3. 使用开发模式: bash npm run dev

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。