
fish-speech-mcp

2025.04.03
1
JavaScript文本到语音合成语音克隆内容生成
fish-speech-mcp 是一个用于文本到语音合成(TTS)的 MCP 服务器,专为大型语言模型(LLMs)设计。它提供了文本到语音转换和保存语音参考的功能,并支持与 Dive 和其他 MCP 兼容的 LLMs 集成。
View on GitHub
Overview
基本能力
产品定位
fish-speech-mcp 是一个专注于文本到语音合成(TTS)的 MCP 服务器,旨在为大型语言模型(LLMs)提供高质量的语音生成能力。
核心功能
- 文本到语音转换:使用 FishSpeech 将文本转换为语音。
- 保存语音参考:保存语音参考以便未来进行语音克隆。
- MCP 集成:与 Dive 和其他 MCP 兼容的 LLMs 无缝集成。
适用场景
- 为 LLMs 提供语音输出功能。
- 语音克隆和个性化语音生成。
- 集成到 Dive Desktop 或其他 MCP 兼容环境中。
工具列表
- text_to_speech:将文本转换为语音。
- 输入:
text
(必填,要转换的文本),reference_id
(可选,保存的语音参考 ID)。 - save_voice_reference:保存语音参考以便未来克隆。
- 输入:
reference_audio
(必填,语音克隆的音频文件路径),reference_text
(必填,音频文件对应的文本)。
常见问题解答
- 如何安装? 可以通过 Dive Desktop 添加 MCP 服务器或手动启动。
- 如何调试? 使用
npm run prepare
和npx @modelcontextprotocol/inspector node ./lib/index.mjs -y
启动调试模式。
使用教程
使用依赖
- Node.js 20+
- MCP 兼容的 LLM 服务
安装教程
- 在 Dive Desktop 中点击 "+ Add MCP Server"。
- 复制并粘贴以下配置:
{
"mcpServers": {
"fish-speech": {
"command": "npx",
"args": [
"-y",
"@demon24ru/fish-speech-mcp"
]
}
}
}
- 点击 "Save" 安装 MCP 服务器。
调试方式
手动启动服务器:
npx @demon24ru/fish-speech-mcp
调试模式:
npm run prepare
npx @modelcontextprotocol/inspector node ./lib/index.mjs -y