Kokoro TTS MCP Server

Kokoro TTS MCP Server

2025.03.06 5

Python文本转语音语音合成内容生成

Kokoro TTS MCP Server 是一个基于 Model Context Protocol (MCP) 的服务器，提供文本转语音（TTS）功能，使用 Kokoro TTS 引擎。该服务器通过 MCP 工具暴露 TTS 功能，便于将语音合成集成到应用程序中。

View on GitHub

Overview

基本能力

产品定位

Kokoro TTS MCP Server 是一个文本转语音（TTS）服务，旨在为开发者提供简单易用的语音合成功能。

核心功能

文本转语音合成，支持自定义语音
可调节语音速度
支持将音频保存为文件或直接播放
跨平台音频播放支持（Windows、macOS、Linux）

适用场景

需要语音合成的应用程序
语音助手开发
语音播报系统
多媒体内容生成

工具列表

generate_speech：生成语音的工具，支持以下参数：
text（必需）：要转换为语音的文本
voice（可选）：用于合成的语音（默认："af_heart"）
speed（可选）：语音速度乘数（默认：1.0）
save_path（可选）：保存音频文件的目录
play_audio（可选）：是否立即播放音频（默认：False）

常见问题解答

音频播放支持哪些平台？
Windows（使用 start）
macOS（使用 afplay）
Linux（使用 aplay）

使用教程

使用依赖

Python 3.10 或更高版本
uv 包管理器

安装教程

首先安装 uv 包管理器：

curl -LsSf https://astral.sh/uv/install.sh | sh

克隆仓库并安装依赖：

uv venv
source .venv/bin/activate  # Windows 用户使用：.venv\Scripts\activate
uv pip install .

调试方式

安装完成后，可以通过以下 Python 代码测试服务：

from mcp.client import Client

async with Client() as client:
    await client.connect("kokoro-tts")

    # 生成并播放语音
    result = await client.call_tool(
        "generate_speech",
        {
            "text": "Hello, world!",
            "voice": "af_heart",
            "speed": 1.0,
            "play_audio": True
        }
    )

许可证

None