Web Scout MCP Server

Web Scout MCP Server

site icon
2025.05.11 1
JavaScript网页搜索内容提取隐私保护并行处理搜索工具浏览器自动化
Web Scout MCP Server 是一个基于 DuckDuckGo 搜索引擎的 MCP 服务,专注于网页搜索和内容提取。它提供了快速、隐私保护的网页搜索能力,并能从网页中提取干净、可读的文本内容。该服务支持并行处理多个 URL,具有智能内存管理和请求限速功能,确保稳定运行。
View on GitHub

Overview

基本能力

产品定位

Web Scout MCP Server 是一个专注于网页搜索和内容提取的 MCP 服务,旨在提供高效、隐私保护的网页信息获取工具。

核心功能

  • DuckDuckGo 搜索:快速且隐私保护的网页搜索能力
  • 内容提取:从网页中提取干净、可读的文本内容
  • 并行处理:支持同时从多个 URL 提取内容
  • 内存优化:智能内存管理,防止应用崩溃
  • 请求限速:智能请求限速,避免 API 被封锁
  • 错误处理:健壮的错误处理,确保可靠运行

适用场景

  • 快速获取网页搜索结果
  • 从多个网页中提取文本内容
  • 需要隐私保护的网页搜索
  • 批量处理网页内容

工具列表

  1. DuckDuckGoWebSearch:使用 DuckDuckGo 搜索引擎进行网页搜索,返回结构化的搜索结果列表。
  2. 输入:query(搜索查询字符串),maxResults(可选,默认 10)
  3. 输出:格式化搜索结果,包含标题、URL 和摘要

  4. UrlContentExtractor:从网页中提取干净、可读的内容,去除脚本、样式和导航等不必要元素。

  5. 输入:单个 URL 或 URL 数组
  6. 输出:指定 URL 的提取文本内容

常见问题解答

  • Node.js 版本要求:需要 Node.js >= 18.0.0
  • 许可证:MIT 许可证

使用教程

使用依赖

  • Node.js >= 18.0.0
  • npm 或 yarn

安装教程

全局安装

npm install -g @pinkpixel/web-scout-mcp

本地安装

npm install @pinkpixel/web-scout-mcp

使用方式

命令行

全局安装后运行:

web-scout-mcp

与 MCP 客户端一起使用

在 MCP 客户端的 config.json 中添加:

{
  "mcpServers": {
    "web-scout": {
      "command": "npx",
      "args": [
        "-y",
        "@pinkpixel/web-scout-mcp"
      ]
    }
  }
}

调试方式

开发模式

# 克隆仓库
git clone https://github.com/pinkpixel-dev/web-scout-mcp.git
cd web-scout-mcp

# 安装依赖
npm install

# 构建
npm run build

# 运行
npm start

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。