
Speech MCP Server

2025.03.29
0
JavaScript文本转语音语音合成内容生成
Koroko Speech MCP Server 是一个基于 Model Context Protocol 的服务器,提供高质量的文本转语音(TTS)功能,使用 Kokoro TTS 模型。该服务器支持多种语音选项和可定制的语音参数(如语速和声音),无需 API 密钥即可使用。
View on GitHub
Overview
基本能力
产品定位
Koroko Speech MCP Server 是一个专注于文本转语音(TTS)的服务,旨在为开发者提供高质量的语音合成能力。
核心功能
- 🎯 使用 Kokoro TTS 模型进行高质量的文本转语音
- 🗣️ 提供多种语音选项
- 🎛️ 可定制的语音参数(声音、语速)
- 🔌 符合 MCP 协议的接口
- 📦 易于安装和设置
- 🚀 无需 API 密钥
适用场景
- 语音助手开发
- 无障碍应用(如屏幕阅读器)
- 教育应用(如语言学习工具)
- 娱乐应用(如游戏语音)
工具列表
- text_to_speech: 使用默认设置将文本转换为语音
- text_to_speech_with_options: 使用可定制的参数将文本转换为语音
- list_voices: 列出所有可用的语音选项
- get_model_status: 检查 TTS 模型的初始化状态
常见问题解答
- 模型初始化问题: 服务器会自动尝试下载和初始化 TTS 模型,最多重试 3 次。如果初始化失败,可以手动删除模型文件并重启服务器。
使用教程
使用依赖
无特殊依赖,只需 Node.js 环境。
安装教程
# 使用 npm
npm install speech-mcp-server
# 使用 pnpm(推荐)
pnpm add speech-mcp-server
# 使用 yarn
yarn add speech-mcp-server
调试方式
# 使用默认配置运行服务器
npm start
# 使用自定义配置运行服务器
MCP_DEFAULT_SPEECH_SPEED=1.5 MCP_DEFAULT_VOICE=af_bella npm start
# 测试服务器
# 列出可用工具
echo '{"type":"request","id":"1","method":"list_tools","params":{}}' | node dist/index.js
# 列出可用语音
echo '{"type":"request","id":"2","method":"list_voices","params":{}}' | node dist/index.js
# 将文本转换为语音
echo '{"type":"request","id":"3","method":"call_tool","params":{"name":"text_to_speech","arguments":{"text":"Hello world","voice":"af_bella"}}}' | node dist/index.js