MS-Lucidia-Voice-Gateway-MCP

MS-Lucidia-Voice-Gateway-MCP

2025.01.17 4

JavaScript语音处理本地语音服务内容生成

MS-Lucidia-Voice-Gateway-MCP 是一个基于 Windows 内置语音服务的 Model Context Protocol (MCP) 服务器，提供文本转语音（TTS）和语音转文本（STT）功能。该服务器通过 PowerShell 命令利用 Windows 原生的语音 API（SAPI），无需依赖外部 API 或服务。

View on GitHub

Overview

基本能力

产品定位

MS-Lucidia-Voice-Gateway-MCP 是一个语音处理服务，专注于文本转语音和语音转文本的功能，适用于需要本地语音处理的场景。

核心功能

文本转语音（TTS）：使用 Windows SAPI 语音引擎将文本转换为语音。
语音转文本（STT）：利用 Windows 语音识别功能将语音转换为文本。
简单易用的 Web 接口：提供测试界面，方便用户快速验证功能。
无外部 API 依赖：完全基于 Windows 原生功能，无需额外服务。

适用场景

无障碍应用：为视障用户提供语音反馈。
语音助手：构建本地语音交互系统。
自动化测试：语音功能的自动化测试。

工具列表

text_to_speech：将文本转换为语音，支持自定义语音和语速。
speech_to_text：将语音转换为文本，支持自定义录音时长。

常见问题解答

语音识别未启用：确保 Windows 语音识别已启用。
语音不可用：检查系统中安装的语音引擎。
语音识别测试：通过 Windows 设置测试语音识别功能。

使用教程

使用依赖

操作系统：Windows 10/11，并启用语音识别。
Node.js：版本 16 或更高。
PowerShell：确保 PowerShell 可用。

安装教程

克隆仓库：

git clone https://github.com/ExpressionsBot/MS-Lucidia-Voice-Gateway-MCP.git
cd MS-Lucidia-Voice-Gateway-MCP

安装依赖：

npm install

构建项目：

npm run build

调试方式

启动测试服务器：

npm run test

访问 http://localhost:3000 使用 Web 界面测试 TTS 和 STT 功能。
测试语音识别：

Add-Type -AssemblyName System.Speech
(New-Object System.Speech.Synthesis.SpeechSynthesizer).GetInstalledVoices().VoiceInfo.Name

许可证

该项目遵循 MIT 开源许可条款。