parquet_mcp_server

parquet_mcp_server

site icon
2025.04.22 2
Python网页搜索内容相似性查找搜索工具
search_mcp_server 是一个强大的 MCP(模型控制协议)服务器,主要用于提供网页搜索和相似内容查找的工具。该服务器设计用于与 Claude Desktop 配合使用,提供两种主要功能:网页搜索和相似性搜索。适用于需要网页搜索功能或基于搜索查询查找相似内容的应用和项目。
View on GitHub

Overview

基本能力

产品定位

search_mcp_server 是一个专注于网页搜索和内容相似性查找的 MCP 服务器,旨在为 Claude Desktop 提供强大的搜索功能支持。

核心功能

  1. 网页搜索:执行网页搜索并抓取结果。
  2. 相似性搜索:从之前的搜索中提取相关信息。

适用场景

  • 需要网页搜索能力的应用程序
  • 需要基于搜索查询查找相似内容的项目

工具列表

  1. Search Web:执行网页搜索并抓取结果
  2. 必需参数:queries(搜索查询列表)
  3. 可选参数:page_number(搜索结果页码,默认为1)
  4. Extract Info from Search:从之前的搜索中提取相关信息
  5. 必需参数:queries(要合并的搜索查询列表)

常见问题解答

  1. SSL 验证错误:确保 .env 文件中的 SSL 设置正确。
  2. 嵌入未生成:检查 Ollama 服务器是否运行且可访问,模型是否可用,输入 Parquet 文件中是否存在文本列。
  3. DuckDB 转换失败:检查输入 Parquet 文件是否存在且可读,输出目录是否有写入权限,文件是否损坏。
  4. PostgreSQL 转换失败:检查 .env 文件中的 PostgreSQL 连接设置是否正确,服务器是否运行且可访问,是否有创建/修改表的权限,pgvector 扩展是否安装。

使用教程

使用依赖

  1. 安装 Smithery CLI(如使用 Smithery 安装): bash npx -y @smithery/cli install @DeepSpringAI/parquet_mcp_server --client claude
  2. 克隆仓库: bash git clone ... cd parquet_mcp_server
  3. 创建并激活虚拟环境: bash uv venv .venv\Scripts\activate # Windows source .venv/bin/activate # macOS/Linux

安装教程

  1. 安装包: bash uv pip install -e .
  2. 创建 .env 文件并配置环境变量: bash EMBEDDING_URL=http://sample-url.com/api/embed OLLAMA_URL=http://sample-url.com/ EMBEDDING_MODEL=sample-model SEARCHAPI_API_KEY=your_searchapi_api_key FIRECRAWL_API_KEY=your_firecrawl_api_key VOYAGE_API_KEY=your_voyage_api_key AZURE_OPENAI_ENDPOINT=http://sample-url.com/azure_openai AZURE_OPENAI_API_KEY=your_azure_openai_api_key

调试方式

  1. 运行测试套件: bash python src/tests/run_tests.py
  2. 运行单个测试: bash python src/tests/test_search_web.py python src/tests/test_extract_info_from_search.py
  3. 使用客户端直接测试: python from parquet_mcp_server.client import perform_search_and_scrape, find_similar_chunks perform_search_and_scrape(["macbook", "laptop"], page_number=1) find_similar_chunks(["macbook"])

许可证

该项目遵循 None 开源许可条款。