mcp-tts-server

mcp-tts-server

site icon
2025.03.30 1
TypeScript文本转语音语音合成内容生成
mcp-tts-server 是一个基于 Model Context Protocol (MCP) 的文本转语音 (TTS) 服务器,利用 Groq API 生成语音。它提供了多种音频输出格式,并支持直接在服务器机器上播放生成的音频。
View on GitHub

Overview

基本能力

产品定位

mcp-tts-server 是一个文本转语音 (TTS) 服务,旨在通过 MCP 协议提供高质量的语音生成功能。

核心功能

  • 实现 MCP 服务器的 TTS 功能。
  • 连接 Groq API (https://api.groq.com/openai/v1/audio/speech) 从文本生成逼真的音频。
  • 提供通过 MCP 协议访问的 generate_speech 工具。
  • 支持多种音频输出格式 (wav, mp3, aac, opus, flac)。
  • 使用 @tropicbliss/symphonia 直接在服务器机器上播放生成的音频(可选)。
  • 需要设置 Groq API 密钥作为环境变量 (GROQ_API_KEY)。

适用场景

  • 语音助手开发
  • 语音合成应用
  • 无障碍服务
  • 多媒体内容生成

工具列表

  • generate_speech:通过 MCP 协议生成语音的工具。

常见问题解答

  • 需要设置 GROQ_API_KEY 环境变量才能使用 Groq API。

使用教程

使用依赖

安装依赖:

bun install

安装教程

在 MCP 客户端上运行服务器(使用 stdio 传输):

{
  "mcpServers": {
    "mcp-tts-server": {
      "command": "bunx",
      "args": [
        "--bun",
        "mcp-tts-server",
      ],
      "env": {
        "GROQ_API_KEY": "gsk_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
      }
    }
  }
}

调试方式

确保 GROQ_API_KEY 环境变量已正确设置,并检查服务器是否正常运行。

许可证

None