
mcp-tts-server

2025.03.30
1
TypeScript文本转语音语音合成内容生成
mcp-tts-server 是一个基于 Model Context Protocol (MCP) 的文本转语音 (TTS) 服务器,利用 Groq API 生成语音。它提供了多种音频输出格式,并支持直接在服务器机器上播放生成的音频。
View on GitHub
Overview
基本能力
产品定位
mcp-tts-server 是一个文本转语音 (TTS) 服务,旨在通过 MCP 协议提供高质量的语音生成功能。
核心功能
- 实现 MCP 服务器的 TTS 功能。
- 连接 Groq API (
https://api.groq.com/openai/v1/audio/speech
) 从文本生成逼真的音频。 - 提供通过 MCP 协议访问的
generate_speech
工具。 - 支持多种音频输出格式 (wav, mp3, aac, opus, flac)。
- 使用
@tropicbliss/symphonia
直接在服务器机器上播放生成的音频(可选)。 - 需要设置 Groq API 密钥作为环境变量 (
GROQ_API_KEY
)。
适用场景
- 语音助手开发
- 语音合成应用
- 无障碍服务
- 多媒体内容生成
工具列表
generate_speech
:通过 MCP 协议生成语音的工具。
常见问题解答
- 需要设置
GROQ_API_KEY
环境变量才能使用 Groq API。
使用教程
使用依赖
安装依赖:
bun install
安装教程
在 MCP 客户端上运行服务器(使用 stdio 传输):
{
"mcpServers": {
"mcp-tts-server": {
"command": "bunx",
"args": [
"--bun",
"mcp-tts-server",
],
"env": {
"GROQ_API_KEY": "gsk_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
}
}
}
}
调试方式
确保 GROQ_API_KEY
环境变量已正确设置,并检查服务器是否正常运行。
许可证
None