
MCP TTS Server

2025.04.16
1
Python文本转语音语音合成内容生成
MCP TTS Server 是一个基于 Model Context Protocol (MCP) 框架构建的多功能文本转语音(TTS)服务器。它通过统一的接口提供对多个 TTS 引擎的访问,包括本地高质量的 Kokoro TTS 和基于云的 OpenAI TTS。该服务器支持实时音频流播放、语音自定义、播放速度调整等功能,适用于需要语音合成的各种场景。
View on GitHub
Overview
基本能力
产品定位
MCP TTS Server 是一个多功能文本转语音(TTS)服务器,旨在通过统一的接口提供对多个 TTS 引擎的访问,支持实时音频流播放和语音自定义。
核心功能
- 多引擎支持:集成 Kokoro TTS(本地)和 OpenAI TTS(云 API)。
- 实时音频流:支持实时音频流播放。
- 语音自定义:通过自然语言指令自定义语音(仅限 OpenAI TTS)。
- 播放控制:支持停止音频播放和清除队列。
- 速度调整:可调整 TTS 引擎的播放速度。
- MCP 协议支持:与 Claude 等 LLM 无缝集成。
适用场景
- 语音助手:为聊天机器人或语音助手提供语音输出。
- 内容生成:将文本内容转换为语音,用于播客、有声书等。
- 无障碍服务:为视障用户提供语音阅读服务。
- 教育工具:用于语言学习或教育内容的语音播放。
工具列表
- tts:将文本转换为语音,支持多引擎和语音自定义。
- tts_stop_playback_and_clear_queue:停止当前播放并清除队列。
- tts_examples:提供有效的语音指令示例。
- get_tts_instructions:获取 TTS 指令。
常见问题解答
- 无音频输出:检查系统音频配置。
- OpenAI TTS 失败:验证 API 密钥是否有效。
- 服务器未找到:确保 MCP 服务器已正确注册。
使用教程
使用依赖
- Python 3.10 或更高版本
- uv 包管理器
- OpenAI API 密钥(用于 OpenAI TTS 功能)
安装教程
# 克隆仓库
git clone https://github.com/kristofferv98/MCP_tts_server.git
cd MCP_tts_server
# 创建虚拟环境并安装依赖
uv venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
uv pip install -e .
# 配置环境变量
cp .env.example .env
# 编辑 .env 文件,添加 OpenAI API 密钥
调试方式
# 直接运行服务器
uv run python tts_mcp.py
# 开发测试
fastmcp dev ./tts_mcp.py