fish-speech-mcp

fish-speech-mcp

site icon
2025.04.03 1
JavaScript文本到语音合成语音克隆内容生成
fish-speech-mcp 是一个用于文本到语音合成(TTS)的 MCP 服务器,专为大型语言模型(LLMs)设计。它提供了文本到语音转换和保存语音参考的功能,并支持与 Dive 和其他 MCP 兼容的 LLMs 集成。
View on GitHub

Overview

基本能力

产品定位

fish-speech-mcp 是一个专注于文本到语音合成(TTS)的 MCP 服务器,旨在为大型语言模型(LLMs)提供高质量的语音生成能力。

核心功能

  • 文本到语音转换:使用 FishSpeech 将文本转换为语音。
  • 保存语音参考:保存语音参考以便未来进行语音克隆。
  • MCP 集成:与 Dive 和其他 MCP 兼容的 LLMs 无缝集成。

适用场景

  • 为 LLMs 提供语音输出功能。
  • 语音克隆和个性化语音生成。
  • 集成到 Dive Desktop 或其他 MCP 兼容环境中。

工具列表

  • text_to_speech:将文本转换为语音。
  • 输入:text(必填,要转换的文本),reference_id(可选,保存的语音参考 ID)。
  • save_voice_reference:保存语音参考以便未来克隆。
  • 输入:reference_audio(必填,语音克隆的音频文件路径),reference_text(必填,音频文件对应的文本)。

常见问题解答

  • 如何安装? 可以通过 Dive Desktop 添加 MCP 服务器或手动启动。
  • 如何调试? 使用 npm run preparenpx @modelcontextprotocol/inspector node ./lib/index.mjs -y 启动调试模式。

使用教程

使用依赖

  • Node.js 20+
  • MCP 兼容的 LLM 服务

安装教程

  1. 在 Dive Desktop 中点击 "+ Add MCP Server"。
  2. 复制并粘贴以下配置:
{
  "mcpServers": {
    "fish-speech": {
      "command": "npx",
      "args": [
        "-y",
        "@demon24ru/fish-speech-mcp"
      ]
    }
  }
}
  1. 点击 "Save" 安装 MCP 服务器。

调试方式

手动启动服务器:

npx @demon24ru/fish-speech-mcp

调试模式:

npm run prepare
npx @modelcontextprotocol/inspector node ./lib/index.mjs -y

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。