fish-speech-mcp

fish-speech-mcp

2025.04.03 1

JavaScript文本到语音合成语音克隆内容生成

fish-speech-mcp 是一个用于文本到语音合成（TTS）的 MCP 服务器，专为大型语言模型（LLMs）设计。它提供了文本到语音转换和保存语音参考的功能，并支持与 Dive 和其他 MCP 兼容的 LLMs 集成。

View on GitHub

Overview

基本能力

产品定位

fish-speech-mcp 是一个专注于文本到语音合成（TTS）的 MCP 服务器，旨在为大型语言模型（LLMs）提供高质量的语音生成能力。

核心功能

文本到语音转换：使用 FishSpeech 将文本转换为语音。
保存语音参考：保存语音参考以便未来进行语音克隆。
MCP 集成：与 Dive 和其他 MCP 兼容的 LLMs 无缝集成。

适用场景

为 LLMs 提供语音输出功能。
语音克隆和个性化语音生成。
集成到 Dive Desktop 或其他 MCP 兼容环境中。

工具列表

text_to_speech：将文本转换为语音。
输入：text（必填，要转换的文本），reference_id（可选，保存的语音参考 ID）。
save_voice_reference：保存语音参考以便未来克隆。
输入：reference_audio（必填，语音克隆的音频文件路径），reference_text（必填，音频文件对应的文本）。

常见问题解答

如何安装？ 可以通过 Dive Desktop 添加 MCP 服务器或手动启动。
如何调试？ 使用 npm run prepare 和 npx @modelcontextprotocol/inspector node ./lib/index.mjs -y 启动调试模式。

使用教程

使用依赖

Node.js 20+
MCP 兼容的 LLM 服务

安装教程

在 Dive Desktop 中点击 "+ Add MCP Server"。
复制并粘贴以下配置：

{
  "mcpServers": {
    "fish-speech": {
      "command": "npx",
      "args": [
        "-y",
        "@demon24ru/fish-speech-mcp"
      ]
    }
  }
}

点击 "Save" 安装 MCP 服务器。

调试方式

手动启动服务器：

npx @demon24ru/fish-speech-mcp

调试模式：

npm run prepare
npx @modelcontextprotocol/inspector node ./lib/index.mjs -y

许可证

该项目遵循 MIT 开源许可条款，请参阅 MIT 了解完整条款。