ElevenLabs Scribe MCP Server

ElevenLabs Scribe MCP Server

site icon
2025.03.12 1
Python语音转文本实时转录上下文管理内容生成
MCP-Elevenlab-Scribe-ASR 是一个基于 Model Control Protocol (MCP) 的服务器实现,专为 ElevenLabs 的 Scribe 语音转文本 API 设计。它提供实时转录功能,支持高级上下文管理和双向流式传输。
View on GitHub

Overview

基本能力

产品定位

MCP-Elevenlab-Scribe-ASR 是一个语音转文本服务,专注于实时转录和上下文管理,适用于需要高质量语音识别的应用场景。

核心功能

  • 实时转录:直接从麦克风流式传输音频并获取即时转录结果。
  • 文件转录:上传音频文件进行批量处理。
  • MCP 协议支持:完整的 Model Control Protocol 实现,用于更好的上下文管理。
  • WebSocket 支持:实时双向通信。
  • 上下文管理:维护对话上下文以提高转录准确性。
  • 多音频格式支持:支持多种音频格式并自动转换。
  • 语言检测:自动检测语言并提供置信度评分。
  • 事件检测:识别语音和非语音音频事件。

适用场景

  • 实时会议记录
  • 语音助手开发
  • 音频内容生成
  • 语音数据分析

工具列表

  • client_example.py:示例客户端,支持文件转录和麦克风转录。
  • main.py:FastAPI 服务器主程序。
  • protocol.py:MCP 协议处理器。
  • elevenlabs.py:ElevenLabs 实现模块。

常见问题解答

  • 如何获取 API 密钥?:需要在 ElevenLabs 官网注册并获取 API 密钥。
  • 支持哪些音频格式?:支持常见的音频格式如 WAV、MP3 等。
  • 如何调试?:可以使用 pytest tests/ 运行测试套件。

使用教程

使用依赖

  1. 确保已安装 Python 3.8+。
  2. 安装依赖库:
pip install FastAPI Uvicorn PyAudio aiohttp python-dotenv pydantic

安装教程

  1. 克隆仓库:
git clone https://github.com/aromanstatue/MCP-Elevenlab-Scribe-ASR.git
cd MCP-Elevenlab-Scribe-ASR
  1. 创建并激活虚拟环境:
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate
  1. 安装依赖:
pip install -e .
  1. 创建 .env 文件并添加 API 密钥:
ELEVENLABS_API_KEY=your-api-key-here

调试方式

  1. 启动服务器:
python -m elevenlabs_scribe_mcp_server.main
  1. 使用示例客户端:
python examples/client_example.py --file path/to/audio.wav
python examples/client_example.py --mic
  1. 运行测试:
pytest tests/

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。