
Embedding MCP Server

2025.03.23
0
Python知识管理语义搜索AI辅助开发效率内容生成
Geeksfino_kb-mcp-server 是一个基于 txtai 的 Model Context Protocol (MCP) 服务器实现,提供语义搜索、知识图谱构建和 AI 驱动的文本处理功能。它通过标准化接口访问知识库,支持多种文档处理和搜索场景。
View on GitHub
Overview
基本能力
产品定位
Geeksfino_kb-mcp-server 是一个基于 txtai 的 MCP 服务器,主要用于构建和管理知识库,提供语义搜索和知识图谱功能。
核心功能
- 语义搜索:基于含义而非关键词进行信息检索
- 知识图谱构建:自动从数据中构建和查询知识图谱
- 文本处理:支持摘要、提取等文本处理流程
- 便携知识库:可将知识库保存为压缩档案,便于共享和加载
- 本地优先架构:所有操作在本地完成,无需依赖外部服务
适用场景
- 技术文档管理和搜索
- 学术研究资料整理和查询
- 企业内部知识库构建
- AI 辅助研究和开发
工具列表
- kb_builder:命令行工具,用于创建和管理知识库
- 处理各种来源的文档
- 提取文本并创建嵌入
- 自动构建知识图谱
- 导出便携知识库
- kb-mcp-server:MCP 服务器,提供标准化接口访问知识库
- 语义搜索能力
- 知识图谱查询和可视化
- 文本处理流程
常见问题解答
- 如何配置 MCP 服务器?
- 通过环境变量或命令行参数配置
- 如何构建知识库?
- 可以使用 kb_builder 工具或直接使用 txtai 的编程接口
- 如何共享知识库?
- 可以将知识库导出为 .tar.gz 文件进行共享
使用教程
使用依赖
需要安装 Python 3.10 和 conda 或 uv 环境管理工具。
安装教程
使用 conda
# 创建新的 conda 环境
conda create -n embedding-mcp python=3.10
conda activate embedding-mcp
# 从 PyPI 安装
pip install kb-mcp-server
从源码安装
# 创建新的 conda 环境
conda create -n embedding-mcp python=3.10
conda activate embedding-mcp
# 克隆仓库
git clone https://github.com/Geeksfino/kb-mcp-server.git.git
cd kb-mcp-server
# 安装依赖
pip install -e .
使用 uv
# 安装 uv
pip install uv
# 创建虚拟环境
uv venv
source .venv/bin/activate
# 从 PyPI 安装
uv pip install kb-mcp-server
调试方式
启动 MCP 服务器
# 使用特定知识库文件夹启动
kb-mcp-server --embeddings /path/to/knowledge_base_folder
# 使用知识库存档启动
kb-mcp-server --embeddings /path/to/knowledge_base.tar.gz
构建知识库
# 从文档构建知识库
kb-build --input /path/to/documents --config config.yml
# 更新现有知识库
kb-build --input /path/to/new_documents --update
# 导出知识库
kb-build --input /path/to/documents --export my_knowledge_base.tar.gz
搜索知识库
# 基本搜索
kb-search /path/to/knowledge_base "What is machine learning?"
# 带图增强的搜索
kb-search /path/to/knowledge_base "What is machine learning?" --graph --limit 10