
MCP TTS VOICEVOX

2025.04.14
1
TypeScript语音合成语音助手语音播报内容生成
mcp-tts-voicevox 是一个基于 VOICEVOX 引擎的语音合成 MCP 服务器,能够将文本转换为语音并进行播放或生成音频文件。它支持多种功能,包括文本到语音的转换、语音合成查询的生成以及音频文件的生成。适用于需要语音合成的各种场景,如语音助手、语音播报、批量音频文件生成等。
View on GitHub
Overview
基本能力
产品定位
mcp-tts-voicevox 是一个基于 VOICEVOX 引擎的语音合成 MCP 服务器,主要用于将文本转换为语音并进行播放或生成音频文件。
核心功能
- 文本到语音的转换:将输入的文本转换为语音并播放。
- 语音合成查询的生成:从文本生成语音合成查询,用于后续的音频文件生成。
- 音频文件的生成:根据语音合成查询生成音频文件。
- 语音生成队列:支持将文本或查询添加到语音生成队列中。
适用场景
- 语音助手:用于语音交互的场景,如语音播报、语音提示等。
- 语音播报:适用于需要实时语音播报的场景,如广播、导航等。
- 批量音频文件生成:适用于需要批量生成音频文件的场景,如语音书籍、语音广告等。
工具列表
- speak:将文本转换为语音并播放。
- generate_query:从文本生成语音合成查询。
- synthesize_file:根据语音合成查询生成音频文件。
常见问题解答
- VOICEVOX 引擎未启动:确保 VOICEVOX 引擎已启动并运行在默认 URL
http://localhost:50021
或通过环境变量VOICEVOX_URL
指定。 - 依赖未安装:确保已安装 Node.js 和 VOICEVOX 引擎。
使用教程
使用依赖
- 安装 Node.js。
- 安装 VOICEVOX 引擎,下载地址:VOICEVOX 引擎。
安装教程
- 使用以下命令全局安装 mcp-tts-voicevox:
npm install -g @kajidog/mcp-tts-voicevox
- 启动 VOICEVOX 引擎。
- 运行以下命令启动 mcp-tts-voicevox:
npx @kajidog/mcp-tts-voicevox
调试方式
- 文本到语音的转换:
await mcp.invoke("speak", {
text: "こんにちは!", // 読み上げるテキスト
speaker: 1 // 話者ID(オプション)
});
- 语音合成查询的生成:
const queryResult = await mcp.invoke("generate_query", {
text: "こんにちは!", // 音声合成するテキスト
speaker: 1 // 話者ID(オプション)
});
// 返されたテキストをJSONにパース
const query = JSON.parse(queryResult.content[0].text);
- 音频文件的生成:
const fileResult = await mcp.invoke("synthesize_file", {
query: query, // 音声合成用クエリ
output: "/path/to/output.wav", // 出力ファイルパス
speaker: 1 // 話者ID(オプション)
});
// 生成された音声ファイルのパス
const filePath = fileResult.content[0].text;