MS-Lucidia-Voice-Gateway-MCP

MS-Lucidia-Voice-Gateway-MCP

site icon
2025.01.17 4
JavaScript语音处理本地语音服务内容生成
MS-Lucidia-Voice-Gateway-MCP 是一个基于 Windows 内置语音服务的 Model Context Protocol (MCP) 服务器,提供文本转语音(TTS)和语音转文本(STT)功能。该服务器通过 PowerShell 命令利用 Windows 原生的语音 API(SAPI),无需依赖外部 API 或服务。
View on GitHub

Overview

基本能力

产品定位

MS-Lucidia-Voice-Gateway-MCP 是一个语音处理服务,专注于文本转语音和语音转文本的功能,适用于需要本地语音处理的场景。

核心功能

  • 文本转语音(TTS):使用 Windows SAPI 语音引擎将文本转换为语音。
  • 语音转文本(STT):利用 Windows 语音识别功能将语音转换为文本。
  • 简单易用的 Web 接口:提供测试界面,方便用户快速验证功能。
  • 无外部 API 依赖:完全基于 Windows 原生功能,无需额外服务。

适用场景

  • 无障碍应用:为视障用户提供语音反馈。
  • 语音助手:构建本地语音交互系统。
  • 自动化测试:语音功能的自动化测试。

工具列表

  • text_to_speech:将文本转换为语音,支持自定义语音和语速。
  • speech_to_text:将语音转换为文本,支持自定义录音时长。

常见问题解答

  1. 语音识别未启用:确保 Windows 语音识别已启用。
  2. 语音不可用:检查系统中安装的语音引擎。
  3. 语音识别测试:通过 Windows 设置测试语音识别功能。

使用教程

使用依赖

  • 操作系统:Windows 10/11,并启用语音识别。
  • Node.js:版本 16 或更高。
  • PowerShell:确保 PowerShell 可用。

安装教程

  1. 克隆仓库:
git clone https://github.com/ExpressionsBot/MS-Lucidia-Voice-Gateway-MCP.git
cd MS-Lucidia-Voice-Gateway-MCP
  1. 安装依赖:
npm install
  1. 构建项目:
npm run build

调试方式

  1. 启动测试服务器:
npm run test
  1. 访问 http://localhost:3000 使用 Web 界面测试 TTS 和 STT 功能。
  2. 测试语音识别:
Add-Type -AssemblyName System.Speech
(New-Object System.Speech.Synthesis.SpeechSynthesizer).GetInstalledVoices().VoiceInfo.Name

许可证

该项目遵循 MIT 开源许可条款。