Voice Recorder MCP Server

Voice Recorder MCP Server

site icon
2025.03.22 4
Python语音转文本音频录制内容生成
Voice Recorder MCP Server 是一个用于录制音频并使用OpenAI的Whisper模型进行转录的MCP服务器。它既可以作为Goose自定义扩展使用,也可以作为独立的MCP服务器运行。该服务器支持从默认麦克风录制音频,并使用Whisper模型进行转录,同时可以与Goose AI代理集成。
View on GitHub

Overview

基本能力

产品定位

Voice Recorder MCP Server 是一个专注于音频录制和转录的工具,旨在通过Whisper模型提供高质量的语音转文本服务。

核心功能

  • 从默认麦克风录制音频
  • 使用Whisper模型转录录音
  • 作为Goose AI代理的自定义扩展集成
  • 包含常见录音场景的提示

适用场景

  • 语音转文本的快速转录
  • 与AI代理集成的语音输入处理
  • 重要录音的高质量转录

工具列表

  • start_recording: 开始从默认麦克风录制音频
  • stop_and_transcribe: 停止录制并转录音频为文本
  • record_and_transcribe: 录制指定时长的音频并转录

常见问题解答

  • 无音频录制: 检查麦克风权限和设置
  • 模型下载错误: 确保初始下载时有稳定的网络连接
  • Goose集成问题: 确保命令路径正确
  • 音频质量问题: 尝试调整采样率(默认:16000)

使用教程

使用依赖

  • Python 3.12+
  • 音频输入设备(麦克风)

安装教程

# 从源代码安装
git clone https://github.com/DefiBax/voice-recorder-mcp.git
cd voice-recorder-mcp
pip install -e .

调试方式

# 使用默认设置运行(base.en模型)
voice-recorder-mcp

# 使用特定Whisper模型运行
voice-recorder-mcp --model medium.en

# 调整采样率
voice-recorder-mcp --sample-rate 44100

使用MCP Inspector测试

# 安装MCP Inspector
npm install -g @modelcontextprotocol/inspector

# 使用检查器运行服务器
npx @modelcontextprotocol/inspector voice-recorder-mcp

与Goose AI代理集成

  1. 打开Goose,进入设置 > 扩展 > 添加 > 命令行扩展
  2. 将名称设置为voice-recorder
  3. 在命令字段中,输入voice-recorder-mcp可执行文件的完整路径
  4. 无需环境变量即可实现基本功能
  5. 与Goose开始对话并引入录音器

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。