Embedding MCP Server

Embedding MCP Server

site icon
2025.03.23 0
Python知识管理语义搜索AI辅助开发效率内容生成
Geeksfino_kb-mcp-server 是一个基于 txtai 的 Model Context Protocol (MCP) 服务器实现,提供语义搜索、知识图谱构建和 AI 驱动的文本处理功能。它通过标准化接口访问知识库,支持多种文档处理和搜索场景。
View on GitHub

Overview

基本能力

产品定位

Geeksfino_kb-mcp-server 是一个基于 txtai 的 MCP 服务器,主要用于构建和管理知识库,提供语义搜索和知识图谱功能。

核心功能

  • 语义搜索:基于含义而非关键词进行信息检索
  • 知识图谱构建:自动从数据中构建和查询知识图谱
  • 文本处理:支持摘要、提取等文本处理流程
  • 便携知识库:可将知识库保存为压缩档案,便于共享和加载
  • 本地优先架构:所有操作在本地完成,无需依赖外部服务

适用场景

  • 技术文档管理和搜索
  • 学术研究资料整理和查询
  • 企业内部知识库构建
  • AI 辅助研究和开发

工具列表

  • kb_builder:命令行工具,用于创建和管理知识库
  • 处理各种来源的文档
  • 提取文本并创建嵌入
  • 自动构建知识图谱
  • 导出便携知识库
  • kb-mcp-server:MCP 服务器,提供标准化接口访问知识库
  • 语义搜索能力
  • 知识图谱查询和可视化
  • 文本处理流程

常见问题解答

  • 如何配置 MCP 服务器?
  • 通过环境变量或命令行参数配置
  • 如何构建知识库?
  • 可以使用 kb_builder 工具或直接使用 txtai 的编程接口
  • 如何共享知识库?
  • 可以将知识库导出为 .tar.gz 文件进行共享

使用教程

使用依赖

需要安装 Python 3.10 和 conda 或 uv 环境管理工具。

安装教程

使用 conda

# 创建新的 conda 环境
conda create -n embedding-mcp python=3.10
conda activate embedding-mcp

# 从 PyPI 安装
pip install kb-mcp-server

从源码安装

# 创建新的 conda 环境
conda create -n embedding-mcp python=3.10
conda activate embedding-mcp

# 克隆仓库
git clone https://github.com/Geeksfino/kb-mcp-server.git.git
cd kb-mcp-server

# 安装依赖
pip install -e .

使用 uv

# 安装 uv
pip install uv

# 创建虚拟环境
uv venv
source .venv/bin/activate

# 从 PyPI 安装
uv pip install kb-mcp-server

调试方式

启动 MCP 服务器

# 使用特定知识库文件夹启动
kb-mcp-server --embeddings /path/to/knowledge_base_folder

# 使用知识库存档启动
kb-mcp-server --embeddings /path/to/knowledge_base.tar.gz

构建知识库

# 从文档构建知识库
kb-build --input /path/to/documents --config config.yml

# 更新现有知识库
kb-build --input /path/to/new_documents --update

# 导出知识库
kb-build --input /path/to/documents --export my_knowledge_base.tar.gz

搜索知识库

# 基本搜索
kb-search /path/to/knowledge_base "What is machine learning?"

# 带图增强的搜索
kb-search /path/to/knowledge_base "What is machine learning?" --graph --limit 10

许可证

该项目遵循 MIT 开源许可条款。