Speech MCP Server

Speech MCP Server

site icon
2025.03.29 0
JavaScript文本转语音语音合成内容生成
Koroko Speech MCP Server 是一个基于 Model Context Protocol 的服务器,提供高质量的文本转语音(TTS)功能,使用 Kokoro TTS 模型。该服务器支持多种语音选项和可定制的语音参数(如语速和声音),无需 API 密钥即可使用。
View on GitHub

Overview

基本能力

产品定位

Koroko Speech MCP Server 是一个专注于文本转语音(TTS)的服务,旨在为开发者提供高质量的语音合成能力。

核心功能

  • 🎯 使用 Kokoro TTS 模型进行高质量的文本转语音
  • 🗣️ 提供多种语音选项
  • 🎛️ 可定制的语音参数(声音、语速)
  • 🔌 符合 MCP 协议的接口
  • 📦 易于安装和设置
  • 🚀 无需 API 密钥

适用场景

  • 语音助手开发
  • 无障碍应用(如屏幕阅读器)
  • 教育应用(如语言学习工具)
  • 娱乐应用(如游戏语音)

工具列表

  1. text_to_speech: 使用默认设置将文本转换为语音
  2. text_to_speech_with_options: 使用可定制的参数将文本转换为语音
  3. list_voices: 列出所有可用的语音选项
  4. get_model_status: 检查 TTS 模型的初始化状态

常见问题解答

  • 模型初始化问题: 服务器会自动尝试下载和初始化 TTS 模型,最多重试 3 次。如果初始化失败,可以手动删除模型文件并重启服务器。

使用教程

使用依赖

无特殊依赖,只需 Node.js 环境。

安装教程

# 使用 npm
npm install speech-mcp-server

# 使用 pnpm(推荐)
pnpm add speech-mcp-server

# 使用 yarn
yarn add speech-mcp-server

调试方式

# 使用默认配置运行服务器
npm start

# 使用自定义配置运行服务器
MCP_DEFAULT_SPEECH_SPEED=1.5 MCP_DEFAULT_VOICE=af_bella npm start

# 测试服务器
# 列出可用工具
echo '{"type":"request","id":"1","method":"list_tools","params":{}}' | node dist/index.js

# 列出可用语音
echo '{"type":"request","id":"2","method":"list_voices","params":{}}' | node dist/index.js

# 将文本转换为语音
echo '{"type":"request","id":"3","method":"call_tool","params":{"name":"text_to_speech","arguments":{"text":"Hello world","voice":"af_bella"}}}' | node dist/index.js

许可证

该项目遵循 MIT 开源许可条款。