mcp-tts-server

mcp-tts-server

2025.03.30 1

TypeScript文本转语音语音合成内容生成

mcp-tts-server 是一个基于 Model Context Protocol (MCP) 的文本转语音 (TTS) 服务器，利用 Groq API 生成语音。它提供了多种音频输出格式，并支持直接在服务器机器上播放生成的音频。

View on GitHub

Overview

基本能力

产品定位

mcp-tts-server 是一个文本转语音 (TTS) 服务，旨在通过 MCP 协议提供高质量的语音生成功能。

核心功能

实现 MCP 服务器的 TTS 功能。
连接 Groq API (https://api.groq.com/openai/v1/audio/speech) 从文本生成逼真的音频。
提供通过 MCP 协议访问的 generate_speech 工具。
支持多种音频输出格式 (wav, mp3, aac, opus, flac)。
使用 @tropicbliss/symphonia 直接在服务器机器上播放生成的音频（可选）。
需要设置 Groq API 密钥作为环境变量 (GROQ_API_KEY)。

适用场景

语音助手开发
语音合成应用
无障碍服务
多媒体内容生成

工具列表

generate_speech：通过 MCP 协议生成语音的工具。

常见问题解答

需要设置 GROQ_API_KEY 环境变量才能使用 Groq API。

使用教程

使用依赖

安装依赖：

bun install

安装教程

在 MCP 客户端上运行服务器（使用 stdio 传输）：

{
  "mcpServers": {
    "mcp-tts-server": {
      "command": "bunx",
      "args": [
        "--bun",
        "mcp-tts-server",
      ],
      "env": {
        "GROQ_API_KEY": "gsk_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
      }
    }
  }
}

调试方式

确保 GROQ_API_KEY 环境变量已正确设置，并检查服务器是否正常运行。

许可证

None