MCP TTS VOICEVOX

MCP TTS VOICEVOX

site icon
2025.04.14 1
TypeScript语音合成语音助手语音播报内容生成
mcp-tts-voicevox 是一个基于 VOICEVOX 引擎的语音合成 MCP 服务器,能够将文本转换为语音并进行播放或生成音频文件。它支持多种功能,包括文本到语音的转换、语音合成查询的生成以及音频文件的生成。适用于需要语音合成的各种场景,如语音助手、语音播报、批量音频文件生成等。
View on GitHub

Overview

基本能力

产品定位

mcp-tts-voicevox 是一个基于 VOICEVOX 引擎的语音合成 MCP 服务器,主要用于将文本转换为语音并进行播放或生成音频文件。

核心功能

  1. 文本到语音的转换:将输入的文本转换为语音并播放。
  2. 语音合成查询的生成:从文本生成语音合成查询,用于后续的音频文件生成。
  3. 音频文件的生成:根据语音合成查询生成音频文件。
  4. 语音生成队列:支持将文本或查询添加到语音生成队列中。

适用场景

  1. 语音助手:用于语音交互的场景,如语音播报、语音提示等。
  2. 语音播报:适用于需要实时语音播报的场景,如广播、导航等。
  3. 批量音频文件生成:适用于需要批量生成音频文件的场景,如语音书籍、语音广告等。

工具列表

  1. speak:将文本转换为语音并播放。
  2. generate_query:从文本生成语音合成查询。
  3. synthesize_file:根据语音合成查询生成音频文件。

常见问题解答

  1. VOICEVOX 引擎未启动:确保 VOICEVOX 引擎已启动并运行在默认 URL http://localhost:50021 或通过环境变量 VOICEVOX_URL 指定。
  2. 依赖未安装:确保已安装 Node.js 和 VOICEVOX 引擎。

使用教程

使用依赖

  1. 安装 Node.js。
  2. 安装 VOICEVOX 引擎,下载地址:VOICEVOX 引擎

安装教程

  1. 使用以下命令全局安装 mcp-tts-voicevox:
npm install -g @kajidog/mcp-tts-voicevox
  1. 启动 VOICEVOX 引擎。
  2. 运行以下命令启动 mcp-tts-voicevox:
npx @kajidog/mcp-tts-voicevox

调试方式

  1. 文本到语音的转换
await mcp.invoke("speak", {
  text: "こんにちは!",  // 読み上げるテキスト
  speaker: 1  // 話者ID(オプション)
});
  1. 语音合成查询的生成
const queryResult = await mcp.invoke("generate_query", {
  text: "こんにちは!",  // 音声合成するテキスト
  speaker: 1  // 話者ID(オプション)
});

// 返されたテキストをJSONにパース
const query = JSON.parse(queryResult.content[0].text);
  1. 音频文件的生成
const fileResult = await mcp.invoke("synthesize_file", {
  query: query,  // 音声合成用クエリ
  output: "/path/to/output.wav",  // 出力ファイルパス
  speaker: 1  // 話者ID(オプション)
});

// 生成された音声ファイルのパス
const filePath = fileResult.content[0].text;

许可证

该项目遵循 ISC 开源许可条款,请参阅 ISC 了解完整条款。