
MS-Lucidia-Voice-Gateway-MCP

2025.01.17
4
JavaScript语音处理本地语音服务内容生成
MS-Lucidia-Voice-Gateway-MCP 是一个基于 Windows 内置语音服务的 Model Context Protocol (MCP) 服务器,提供文本转语音(TTS)和语音转文本(STT)功能。该服务器通过 PowerShell 命令利用 Windows 原生的语音 API(SAPI),无需依赖外部 API 或服务。
View on GitHub
Overview
基本能力
产品定位
MS-Lucidia-Voice-Gateway-MCP 是一个语音处理服务,专注于文本转语音和语音转文本的功能,适用于需要本地语音处理的场景。
核心功能
- 文本转语音(TTS):使用 Windows SAPI 语音引擎将文本转换为语音。
- 语音转文本(STT):利用 Windows 语音识别功能将语音转换为文本。
- 简单易用的 Web 接口:提供测试界面,方便用户快速验证功能。
- 无外部 API 依赖:完全基于 Windows 原生功能,无需额外服务。
适用场景
- 无障碍应用:为视障用户提供语音反馈。
- 语音助手:构建本地语音交互系统。
- 自动化测试:语音功能的自动化测试。
工具列表
- text_to_speech:将文本转换为语音,支持自定义语音和语速。
- speech_to_text:将语音转换为文本,支持自定义录音时长。
常见问题解答
- 语音识别未启用:确保 Windows 语音识别已启用。
- 语音不可用:检查系统中安装的语音引擎。
- 语音识别测试:通过 Windows 设置测试语音识别功能。
使用教程
使用依赖
- 操作系统:Windows 10/11,并启用语音识别。
- Node.js:版本 16 或更高。
- PowerShell:确保 PowerShell 可用。
安装教程
- 克隆仓库:
git clone https://github.com/ExpressionsBot/MS-Lucidia-Voice-Gateway-MCP.git
cd MS-Lucidia-Voice-Gateway-MCP
- 安装依赖:
npm install
- 构建项目:
npm run build
调试方式
- 启动测试服务器:
npm run test
- 访问
http://localhost:3000
使用 Web 界面测试 TTS 和 STT 功能。 - 测试语音识别:
Add-Type -AssemblyName System.Speech
(New-Object System.Speech.Synthesis.SpeechSynthesizer).GetInstalledVoices().VoiceInfo.Name