Why txtai?

Why txtai?

site icon
2025.04.16 10754
Python语义搜索LLM 编排语言模型工作流内容生成开发效率
txtai 是一个全功能的嵌入数据库,专注于语义搜索、大型语言模型(LLM)编排和语言模型工作流。它结合了向量索引(稀疏和密集)、图网络和关系数据库,支持向量搜索,并作为大型语言模型应用的强大知识源。txtai 可用于构建自主代理、检索增强生成(RAG)流程、多模型工作流等。
View on GitHub

Overview

基本能力

产品定位

txtai 是一个全功能的嵌入数据库,专注于语义搜索、大型语言模型(LLM)编排和语言模型工作流。

核心功能

  • 向量搜索:支持 SQL、对象存储、主题建模、图分析和多模态索引。
  • 嵌入创建:为文本、文档、音频、图像和视频创建嵌入。
  • 管道:由语言模型驱动的管道,可运行 LLM 提示、问答、标签、转录、翻译、摘要等。
  • 工作流:将管道连接在一起并聚合业务逻辑。
  • 代理:智能连接嵌入、管道、工作流和其他代理,以自主解决复杂问题。
  • API:提供 Web 和模型上下文协议(MCP)API,支持 JavaScript、Java、Rust 和 Go 的绑定。
  • 本地或云端运行:可在本地运行,也可通过容器编排扩展。

适用场景

  • 语义搜索:构建语义/相似性/向量/神经搜索应用。
  • LLM 编排:自主代理、检索增强生成(RAG)、与数据聊天、管道和工作流。
  • 语言模型工作流:连接语言模型以构建智能应用。

工具列表

  • rag:检索增强生成(RAG)应用。
  • ragdata:为 RAG 构建知识库。
  • paperai:医学/科学论文的语义搜索和工作流。
  • annotateai:使用 LLM 自动注释论文。

常见问题解答

  • 如何安装:通过 pip 安装 pip install txtai
  • 依赖:Python 3.10+、Hugging Face Transformers、Sentence Transformers 和 FastAPI。
  • 模型推荐:提供了嵌入、图像标题、标签、LLM、摘要、文本到语音、转录和翻译的推荐模型。

使用教程

使用依赖

确保已安装 Python 3.10+,并建议使用虚拟环境。

python -m venv txtai-env
source txtai-env/bin/activate

安装教程

通过 pip 安装 txtai:

pip install txtai

调试方式

启动 API 服务:

CONFIG=app.yml uvicorn "txtai.api:app"

测试搜索功能:

curl -X GET "http://localhost:8000/search?query=positive"

许可证

该项目遵循 Apache-2.0 开源许可条款,请参阅 Apache-2.0 了解完整条款。