
ElevenLabs Scribe MCP Server

2025.03.12
1
Python语音转文本实时转录上下文管理内容生成
MCP-Elevenlab-Scribe-ASR 是一个基于 Model Control Protocol (MCP) 的服务器实现,专为 ElevenLabs 的 Scribe 语音转文本 API 设计。它提供实时转录功能,支持高级上下文管理和双向流式传输。
View on GitHub
Overview
基本能力
产品定位
MCP-Elevenlab-Scribe-ASR 是一个语音转文本服务,专注于实时转录和上下文管理,适用于需要高质量语音识别的应用场景。
核心功能
- 实时转录:直接从麦克风流式传输音频并获取即时转录结果。
- 文件转录:上传音频文件进行批量处理。
- MCP 协议支持:完整的 Model Control Protocol 实现,用于更好的上下文管理。
- WebSocket 支持:实时双向通信。
- 上下文管理:维护对话上下文以提高转录准确性。
- 多音频格式支持:支持多种音频格式并自动转换。
- 语言检测:自动检测语言并提供置信度评分。
- 事件检测:识别语音和非语音音频事件。
适用场景
- 实时会议记录
- 语音助手开发
- 音频内容生成
- 语音数据分析
工具列表
- client_example.py:示例客户端,支持文件转录和麦克风转录。
- main.py:FastAPI 服务器主程序。
- protocol.py:MCP 协议处理器。
- elevenlabs.py:ElevenLabs 实现模块。
常见问题解答
- 如何获取 API 密钥?:需要在 ElevenLabs 官网注册并获取 API 密钥。
- 支持哪些音频格式?:支持常见的音频格式如 WAV、MP3 等。
- 如何调试?:可以使用
pytest tests/
运行测试套件。
使用教程
使用依赖
- 确保已安装 Python 3.8+。
- 安装依赖库:
pip install FastAPI Uvicorn PyAudio aiohttp python-dotenv pydantic
安装教程
- 克隆仓库:
git clone https://github.com/aromanstatue/MCP-Elevenlab-Scribe-ASR.git
cd MCP-Elevenlab-Scribe-ASR
- 创建并激活虚拟环境:
python -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
- 安装依赖:
pip install -e .
- 创建
.env
文件并添加 API 密钥:
ELEVENLABS_API_KEY=your-api-key-here
调试方式
- 启动服务器:
python -m elevenlabs_scribe_mcp_server.main
- 使用示例客户端:
python examples/client_example.py --file path/to/audio.wav
python examples/client_example.py --mic
- 运行测试:
pytest tests/