Web Search MCP Server

Web Search MCP Server

site icon
2025.04.17 0
Python网页搜索新闻聚合百科搜索搜索工具
mcp-websearch 是一个基于 Model Context Protocol (MCP) 的服务器实现,专门用于从印度尼西亚新闻门户和维基百科搜索内容。它可以部署为 Google Cloud Function,为 LLM 提供标准化的数据源接入方式。
View on GitHub

Overview

基本能力

产品定位

mcp-websearch 是一个基于 MCP 协议的搜索服务,专注于从特定新闻门户和维基百科获取内容,为 AI 应用提供标准化的数据接入。

核心功能

  • 支持从多个印度尼西亚新闻门户(detik、liputan6、cnn)和维基百科搜索内容
  • 遵循 MCP 协议,提供标准化的资源访问接口
  • 可部署为 Google Cloud Function,实现弹性扩展
  • 支持异步请求处理,提高性能

适用场景

  • AI 应用需要接入新闻和百科数据源
  • 开发者需要为 LLM 提供标准化的搜索功能
  • 需要快速部署可扩展的搜索服务

工具列表

  • Serper API:用于执行实际的网页搜索
  • BeautifulSoup4:用于解析 HTML 内容
  • httpx 和 aiohttp:用于异步 HTTP 请求

常见问题解答

  • 错误处理:服务会返回标准化的错误响应,包括 400(参数错误)、404(功能未找到)和 500(服务器错误)
  • 限制:默认超时 60 秒,内存 256MB,受 Serper API 速率限制
  • 目前仅支持印度尼西亚新闻门户和维基百科

使用教程

使用依赖

  • Python 3.11 或更高版本
  • Google Cloud SDK
  • Google Cloud 账户(已启用结算)
  • Serper API 密钥

安装教程

  1. 克隆仓库:
git clone [email protected]:addhe/mcp-websearch.git
cd mcp-websearch
  1. 创建并激活虚拟环境:
python -m venv .venv
source .venv/bin/activate  # Windows 使用: .venv\Scripts\activate
  1. 安装依赖:
pip install -r requirements.txt
  1. 创建 .env 文件并添加 Serper API 密钥:
SERPER_API_KEY=your_api_key_here
  1. 本地运行:
python main.py

调试方式

  1. 部署到 Google Cloud Functions 后,可以通过发送 HTTP POST 请求测试功能:
{
    "name": "get_docs",
    "parameters": {
        "query": "your search query",
        "library": "detik|liputan6|cnn|wikipedia"
    }
}
  1. 预期成功响应:
{
    "result": "Text content from the searched portal",
    "type": "success"
}
  1. 错误响应示例:
{
    "error": "Error message",
    "type": "error"
}

许可证

该项目遵循 MIT 开源许可条款。