MCP TTS VOICEVOX

MCP TTS VOICEVOX

2025.04.14 1

TypeScript语音合成语音助手语音播报内容生成

mcp-tts-voicevox 是一个基于 VOICEVOX 引擎的语音合成 MCP 服务器，能够将文本转换为语音并进行播放或生成音频文件。它支持多种功能，包括文本到语音的转换、语音合成查询的生成以及音频文件的生成。适用于需要语音合成的各种场景，如语音助手、语音播报、批量音频文件生成等。

View on GitHub

Overview

基本能力

产品定位

mcp-tts-voicevox 是一个基于 VOICEVOX 引擎的语音合成 MCP 服务器，主要用于将文本转换为语音并进行播放或生成音频文件。

核心功能

文本到语音的转换：将输入的文本转换为语音并播放。
语音合成查询的生成：从文本生成语音合成查询，用于后续的音频文件生成。
音频文件的生成：根据语音合成查询生成音频文件。
语音生成队列：支持将文本或查询添加到语音生成队列中。

适用场景

语音助手：用于语音交互的场景，如语音播报、语音提示等。
语音播报：适用于需要实时语音播报的场景，如广播、导航等。
批量音频文件生成：适用于需要批量生成音频文件的场景，如语音书籍、语音广告等。

工具列表

speak：将文本转换为语音并播放。
generate_query：从文本生成语音合成查询。
synthesize_file：根据语音合成查询生成音频文件。

常见问题解答

VOICEVOX 引擎未启动：确保 VOICEVOX 引擎已启动并运行在默认 URL http://localhost:50021 或通过环境变量 VOICEVOX_URL 指定。
依赖未安装：确保已安装 Node.js 和 VOICEVOX 引擎。

使用教程

使用依赖

安装 Node.js。
安装 VOICEVOX 引擎，下载地址：VOICEVOX 引擎。

安装教程

使用以下命令全局安装 mcp-tts-voicevox：

npm install -g @kajidog/mcp-tts-voicevox

启动 VOICEVOX 引擎。
运行以下命令启动 mcp-tts-voicevox：

npx @kajidog/mcp-tts-voicevox

调试方式

文本到语音的转换：

await mcp.invoke("speak", {
  text: "こんにちは！",  // 読み上げるテキスト
  speaker: 1  // 話者ID（オプション）
});

语音合成查询的生成：

const queryResult = await mcp.invoke("generate_query", {
  text: "こんにちは！",  // 音声合成するテキスト
  speaker: 1  // 話者ID（オプション）
});

// 返されたテキストをJSONにパース
const query = JSON.parse(queryResult.content[0].text);

音频文件的生成：

const fileResult = await mcp.invoke("synthesize_file", {
  query: query,  // 音声合成用クエリ
  output: "/path/to/output.wav",  // 出力ファイルパス
  speaker: 1  // 話者ID（オプション）
});

// 生成された音声ファイルのパス
const filePath = fileResult.content[0].text;

许可证

该项目遵循 ISC 开源许可条款，请参阅 ISC 了解完整条款。