Model Context Protocol (MCP) Server for the RAG Web Browser Actor 🌐

Model Context Protocol (MCP) Server for the RAG Web Browser Actor 🌐

site icon
2025.03.17 119
JavaScript网络搜索内容抓取AI代理支持浏览器自动化开发效率
该MCP服务器是为RAG Web Browser Actor设计的实现,专门为大型语言模型(LLMs)和RAG管道提供快速的网络交互和信息提取能力。它允许AI代理执行网络搜索、抓取网页内容并以Markdown格式返回,适用于需要实时网络数据支持的AI应用场景。
View on GitHub

Overview

基本能力

产品定位

该MCP服务器旨在为AI代理和大型语言模型提供快速响应,使其能够与网络交互并从网页中提取信息。

核心功能

  • 执行网络搜索并抓取结果中的前N个URL,返回清理后的Markdown内容
  • 获取单个URL的内容并以Markdown格式返回

适用场景

  • AI代理需要实时网络数据支持的应用
  • RAG管道中需要从网页提取信息的场景
  • 开发需要网络搜索和内容抓取功能的AI工具

工具列表

  • search: 查询Google搜索,抓取结果中的前N个URL并返回清理后的Markdown内容。参数包括:
  • query(必需):搜索词或URL
  • maxResults(可选):要抓取的搜索结果最大数量(默认:1)
  • scrapingTool(可选):选择用于提取网页的抓取工具,选项:'browser-playwright'或'raw-http'(默认:'raw-http')
  • outputFormats(可选):选择一个或多个输出格式,选项:'text', 'markdown', 'html'(默认:['markdown'])
  • requestTimeoutSecs(可选):请求的最大时间(秒)(默认:40)

常见问题解答

  • 如何确认服务器已连接?在Claude Desktop中查找🔌图标
  • 调试建议:使用MCP Inspector进行调试
  • 运行问题:确保已安装最新版Claude Desktop和Node.js v18+

使用教程

使用依赖

  • MacOS或Windows系统
  • 已安装最新版Claude Desktop(或其他MCP客户端)
  • Node.js(v18或更高版本)
  • Apify API Token(APIFY_TOKEN

安装教程

  1. 克隆仓库:
git clone [email protected]:apify/mcp-server-rag-web-browser.git
  1. 进入项目目录并安装依赖:
cd mcp-server-rag-web-browser
npm install
  1. 构建项目:
npm run build
  1. 配置Claude Desktop:
  2. 编辑配置文件(macOS: ~/Library/Application\ Support/Claude/claude_desktop_config.json,Windows: %APPDATA%/Claude/claude_desktop_config.json
  3. 添加服务器配置并设置APIFY_TOKEN
  4. 重启Claude Desktop

调试方式

  1. 使用MCP Inspector调试:
export APIFY_TOKEN=your-apify-api-token
npx @modelcontextprotocol/inspector npx -y @apify/mcp-server-rag-web-browser
  1. 本地测试(stdio):
export APIFY_TOKEN=your-apify-api-token
node dist/example_client_stdio.js
  1. 直接API调用测试:
export APIFY_TOKEN=your-apify-api-token
node dist/example_call_web_browser.js

许可证

该项目遵循 Apache-2.0 开源许可条款,请参阅 Apache-2.0 了解完整条款。