
Voice Recorder MCP Server

2025.03.22
4
Python语音转文本音频录制内容生成
Voice Recorder MCP Server 是一个用于录制音频并使用OpenAI的Whisper模型进行转录的MCP服务器。它既可以作为Goose自定义扩展使用,也可以作为独立的MCP服务器运行。该服务器支持从默认麦克风录制音频,并使用Whisper模型进行转录,同时可以与Goose AI代理集成。
View on GitHub
Overview
基本能力
产品定位
Voice Recorder MCP Server 是一个专注于音频录制和转录的工具,旨在通过Whisper模型提供高质量的语音转文本服务。
核心功能
- 从默认麦克风录制音频
- 使用Whisper模型转录录音
- 作为Goose AI代理的自定义扩展集成
- 包含常见录音场景的提示
适用场景
- 语音转文本的快速转录
- 与AI代理集成的语音输入处理
- 重要录音的高质量转录
工具列表
start_recording
: 开始从默认麦克风录制音频stop_and_transcribe
: 停止录制并转录音频为文本record_and_transcribe
: 录制指定时长的音频并转录
常见问题解答
- 无音频录制: 检查麦克风权限和设置
- 模型下载错误: 确保初始下载时有稳定的网络连接
- Goose集成问题: 确保命令路径正确
- 音频质量问题: 尝试调整采样率(默认:16000)
使用教程
使用依赖
- Python 3.12+
- 音频输入设备(麦克风)
安装教程
# 从源代码安装
git clone https://github.com/DefiBax/voice-recorder-mcp.git
cd voice-recorder-mcp
pip install -e .
调试方式
# 使用默认设置运行(base.en模型)
voice-recorder-mcp
# 使用特定Whisper模型运行
voice-recorder-mcp --model medium.en
# 调整采样率
voice-recorder-mcp --sample-rate 44100
使用MCP Inspector测试
# 安装MCP Inspector
npm install -g @modelcontextprotocol/inspector
# 使用检查器运行服务器
npx @modelcontextprotocol/inspector voice-recorder-mcp
与Goose AI代理集成
- 打开Goose,进入设置 > 扩展 > 添加 > 命令行扩展
- 将名称设置为
voice-recorder
- 在命令字段中,输入voice-recorder-mcp可执行文件的完整路径
- 无需环境变量即可实现基本功能
- 与Goose开始对话并引入录音器