parquet_mcp_server

parquet_mcp_server

site icon
2025.04.21 0
Python网页搜索内容相似性查找搜索工具
DeepSpringAI_search_mcp_server 是一个强大的 MCP(模型控制协议)服务器,主要用于提供网页搜索和相似内容查找的功能。该服务器设计用于与 Claude Desktop 配合使用,具有两大核心功能:网页搜索和相似性搜索。适用于需要网页搜索能力或基于搜索查询查找相似内容的应用和项目。
View on GitHub

Overview

基本能力

产品定位

DeepSpringAI_search_mcp_server 是一个专注于网页搜索和内容相似性查找的 MCP 服务器。

核心功能

  1. 网页搜索:执行网页搜索并抓取结果。
  2. 相似性搜索:从之前的搜索中提取相关信息。

适用场景

  • 需要网页搜索能力的应用程序。
  • 需要基于搜索查询查找相似内容的项目。

工具列表

  1. Search Web:执行网页搜索并抓取结果。
  2. 必需参数:queries(搜索查询列表)。
  3. 可选参数:page_number(搜索结果页码,默认为1)。
  4. Extract Info from Search:从之前的搜索中提取相关信息。
  5. 必需参数:queries(要合并的搜索查询列表)。

常见问题解答

  1. SSL 验证错误:确保 .env 文件中的 SSL 设置正确。
  2. 嵌入未生成:检查 Ollama 服务器是否运行且可访问,模型是否可用,输入 Parquet 文件中是否存在文本列。
  3. DuckDB 转换失败:检查输入 Parquet 文件是否存在且可读,输出目录是否有写权限,文件是否损坏。
  4. PostgreSQL 转换失败:检查 .env 文件中的 PostgreSQL 连接设置是否正确,服务器是否运行且可访问,是否有必要的权限,pgvector 扩展是否安装。

使用教程

使用依赖

  1. 安装 Smithery: bash npx -y @smithery/cli install @DeepSpringAI/parquet_mcp_server --client claude
  2. 克隆仓库: bash git clone ... cd parquet_mcp_server
  3. 创建并激活虚拟环境: bash uv venv .venv\Scripts\activate # On Windows source .venv/bin/activate # On macOS/Linux
  4. 安装包: bash uv pip install -e .
  5. 创建 .env 文件并配置环境变量。

安装教程

  1. 通过 Smithery 安装: bash npx -y @smithery/cli install @DeepSpringAI/parquet_mcp_server --client claude
  2. 或手动安装: bash git clone ... cd parquet_mcp_server uv venv .venv\Scripts\activate # On Windows source .venv/bin/activate # On macOS/Linux uv pip install -e .

调试方式

  1. 运行测试: bash python src/tests/run_tests.py
  2. 或运行单个测试: bash python src/tests/test_search_web.py python src/tests/test_extract_info_from_search.py
  3. 使用客户端直接测试: python from parquet_mcp_server.client import perform_search_and_scrape, find_similar_chunks perform_search_and_scrape(["macbook", "laptop"], page_number=1) find_similar_chunks(["macbook"])

许可证

该项目遵循 None 开源许可条款。