
Kokoro TTS MCP Server

2025.03.06
5
Python文本转语音语音合成内容生成
Kokoro TTS MCP Server 是一个基于 Model Context Protocol (MCP) 的服务器,提供文本转语音(TTS)功能,使用 Kokoro TTS 引擎。该服务器通过 MCP 工具暴露 TTS 功能,便于将语音合成集成到应用程序中。
View on GitHub
Overview
基本能力
产品定位
Kokoro TTS MCP Server 是一个文本转语音(TTS)服务,旨在为开发者提供简单易用的语音合成功能。
核心功能
- 文本转语音合成,支持自定义语音
- 可调节语音速度
- 支持将音频保存为文件或直接播放
- 跨平台音频播放支持(Windows、macOS、Linux)
适用场景
- 需要语音合成的应用程序
- 语音助手开发
- 语音播报系统
- 多媒体内容生成
工具列表
generate_speech
:生成语音的工具,支持以下参数:text
(必需):要转换为语音的文本voice
(可选):用于合成的语音(默认:"af_heart")speed
(可选):语音速度乘数(默认:1.0)save_path
(可选):保存音频文件的目录play_audio
(可选):是否立即播放音频(默认:False)
常见问题解答
- 音频播放支持哪些平台?
- Windows(使用
start
) - macOS(使用
afplay
) - Linux(使用
aplay
)
使用教程
使用依赖
- Python 3.10 或更高版本
uv
包管理器
安装教程
- 首先安装
uv
包管理器:
curl -LsSf https://astral.sh/uv/install.sh | sh
- 克隆仓库并安装依赖:
uv venv
source .venv/bin/activate # Windows 用户使用:.venv\Scripts\activate
uv pip install .
调试方式
安装完成后,可以通过以下 Python 代码测试服务:
from mcp.client import Client
async with Client() as client:
await client.connect("kokoro-tts")
# 生成并播放语音
result = await client.call_tool(
"generate_speech",
{
"text": "Hello, world!",
"voice": "af_heart",
"speed": 1.0,
"play_audio": True
}
)
许可证
None