MCP TTS Server

MCP TTS Server

2025.04.16 1

Python文本转语音语音合成内容生成

MCP TTS Server 是一个基于 Model Context Protocol (MCP) 框架构建的多功能文本转语音（TTS）服务器。它通过统一的接口提供对多个 TTS 引擎的访问，包括本地高质量的 Kokoro TTS 和基于云的 OpenAI TTS。该服务器支持实时音频流播放、语音自定义、播放速度调整等功能，适用于需要语音合成的各种场景。

View on GitHub

Overview

基本能力

产品定位

MCP TTS Server 是一个多功能文本转语音（TTS）服务器，旨在通过统一的接口提供对多个 TTS 引擎的访问，支持实时音频流播放和语音自定义。

核心功能

多引擎支持：集成 Kokoro TTS（本地）和 OpenAI TTS（云 API）。
实时音频流：支持实时音频流播放。
语音自定义：通过自然语言指令自定义语音（仅限 OpenAI TTS）。
播放控制：支持停止音频播放和清除队列。
速度调整：可调整 TTS 引擎的播放速度。
MCP 协议支持：与 Claude 等 LLM 无缝集成。

适用场景

语音助手：为聊天机器人或语音助手提供语音输出。
内容生成：将文本内容转换为语音，用于播客、有声书等。
无障碍服务：为视障用户提供语音阅读服务。
教育工具：用于语言学习或教育内容的语音播放。

工具列表

tts：将文本转换为语音，支持多引擎和语音自定义。
tts_stop_playback_and_clear_queue：停止当前播放并清除队列。
tts_examples：提供有效的语音指令示例。
get_tts_instructions：获取 TTS 指令。

常见问题解答

无音频输出：检查系统音频配置。
OpenAI TTS 失败：验证 API 密钥是否有效。
服务器未找到：确保 MCP 服务器已正确注册。

使用教程

使用依赖

Python 3.10 或更高版本
uv 包管理器
OpenAI API 密钥（用于 OpenAI TTS 功能）

安装教程

# 克隆仓库
git clone https://github.com/kristofferv98/MCP_tts_server.git
cd MCP_tts_server

# 创建虚拟环境并安装依赖
uv venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
uv pip install -e .

# 配置环境变量
cp .env.example .env
# 编辑 .env 文件，添加 OpenAI API 密钥

调试方式

# 直接运行服务器
uv run python tts_mcp.py

# 开发测试
fastmcp dev ./tts_mcp.py

许可证

该项目遵循 Other 开源许可条款，请参阅 Other 了解完整条款。