MCP TTS Server

MCP TTS Server

site icon
2025.04.16 1
Python文本转语音语音合成内容生成
MCP TTS Server 是一个基于 Model Context Protocol (MCP) 框架构建的多功能文本转语音(TTS)服务器。它通过统一的接口提供对多个 TTS 引擎的访问,包括本地高质量的 Kokoro TTS 和基于云的 OpenAI TTS。该服务器支持实时音频流播放、语音自定义、播放速度调整等功能,适用于需要语音合成的各种场景。
View on GitHub

Overview

基本能力

产品定位

MCP TTS Server 是一个多功能文本转语音(TTS)服务器,旨在通过统一的接口提供对多个 TTS 引擎的访问,支持实时音频流播放和语音自定义。

核心功能

  • 多引擎支持:集成 Kokoro TTS(本地)和 OpenAI TTS(云 API)。
  • 实时音频流:支持实时音频流播放。
  • 语音自定义:通过自然语言指令自定义语音(仅限 OpenAI TTS)。
  • 播放控制:支持停止音频播放和清除队列。
  • 速度调整:可调整 TTS 引擎的播放速度。
  • MCP 协议支持:与 Claude 等 LLM 无缝集成。

适用场景

  • 语音助手:为聊天机器人或语音助手提供语音输出。
  • 内容生成:将文本内容转换为语音,用于播客、有声书等。
  • 无障碍服务:为视障用户提供语音阅读服务。
  • 教育工具:用于语言学习或教育内容的语音播放。

工具列表

  1. tts:将文本转换为语音,支持多引擎和语音自定义。
  2. tts_stop_playback_and_clear_queue:停止当前播放并清除队列。
  3. tts_examples:提供有效的语音指令示例。
  4. get_tts_instructions:获取 TTS 指令。

常见问题解答

  • 无音频输出:检查系统音频配置。
  • OpenAI TTS 失败:验证 API 密钥是否有效。
  • 服务器未找到:确保 MCP 服务器已正确注册。

使用教程

使用依赖

  • Python 3.10 或更高版本
  • uv 包管理器
  • OpenAI API 密钥(用于 OpenAI TTS 功能)

安装教程

# 克隆仓库
git clone https://github.com/kristofferv98/MCP_tts_server.git
cd MCP_tts_server

# 创建虚拟环境并安装依赖
uv venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
uv pip install -e .

# 配置环境变量
cp .env.example .env
# 编辑 .env 文件,添加 OpenAI API 密钥

调试方式

# 直接运行服务器
uv run python tts_mcp.py

# 开发测试
fastmcp dev ./tts_mcp.py

许可证

该项目遵循 Other 开源许可条款,请参阅 Other 了解完整条款。