Kokoro TTS MCP Server

Kokoro TTS MCP Server

site icon
2025.03.06 5
Python文本转语音语音合成内容生成
Kokoro TTS MCP Server 是一个基于 Model Context Protocol (MCP) 的服务器,提供文本转语音(TTS)功能,使用 Kokoro TTS 引擎。该服务器通过 MCP 工具暴露 TTS 功能,便于将语音合成集成到应用程序中。
View on GitHub

Overview

基本能力

产品定位

Kokoro TTS MCP Server 是一个文本转语音(TTS)服务,旨在为开发者提供简单易用的语音合成功能。

核心功能

  • 文本转语音合成,支持自定义语音
  • 可调节语音速度
  • 支持将音频保存为文件或直接播放
  • 跨平台音频播放支持(Windows、macOS、Linux)

适用场景

  • 需要语音合成的应用程序
  • 语音助手开发
  • 语音播报系统
  • 多媒体内容生成

工具列表

  • generate_speech:生成语音的工具,支持以下参数:
  • text(必需):要转换为语音的文本
  • voice(可选):用于合成的语音(默认:"af_heart")
  • speed(可选):语音速度乘数(默认:1.0)
  • save_path(可选):保存音频文件的目录
  • play_audio(可选):是否立即播放音频(默认:False)

常见问题解答

  • 音频播放支持哪些平台?
  • Windows(使用 start
  • macOS(使用 afplay
  • Linux(使用 aplay

使用教程

使用依赖

  • Python 3.10 或更高版本
  • uv 包管理器

安装教程

  1. 首先安装 uv 包管理器:
curl -LsSf https://astral.sh/uv/install.sh | sh
  1. 克隆仓库并安装依赖:
uv venv
source .venv/bin/activate  # Windows 用户使用:.venv\Scripts\activate
uv pip install .

调试方式

安装完成后,可以通过以下 Python 代码测试服务:

from mcp.client import Client

async with Client() as client:
    await client.connect("kokoro-tts")

    # 生成并播放语音
    result = await client.call_tool(
        "generate_speech",
        {
            "text": "Hello, world!",
            "voice": "af_heart",
            "speed": 1.0,
            "play_audio": True
        }
    )

许可证

None