Voice Recorder MCP Server

Voice Recorder MCP Server

2025.03.22 4

Python语音转文本音频录制内容生成

Voice Recorder MCP Server 是一个用于录制音频并使用OpenAI的Whisper模型进行转录的MCP服务器。它既可以作为Goose自定义扩展使用，也可以作为独立的MCP服务器运行。该服务器支持从默认麦克风录制音频，并使用Whisper模型进行转录，同时可以与Goose AI代理集成。

View on GitHub

Overview

基本能力

产品定位

Voice Recorder MCP Server 是一个专注于音频录制和转录的工具，旨在通过Whisper模型提供高质量的语音转文本服务。

核心功能

从默认麦克风录制音频
使用Whisper模型转录录音
作为Goose AI代理的自定义扩展集成
包含常见录音场景的提示

适用场景

语音转文本的快速转录
与AI代理集成的语音输入处理
重要录音的高质量转录

工具列表

start_recording: 开始从默认麦克风录制音频
stop_and_transcribe: 停止录制并转录音频为文本
record_and_transcribe: 录制指定时长的音频并转录

常见问题解答

无音频录制: 检查麦克风权限和设置
模型下载错误: 确保初始下载时有稳定的网络连接
Goose集成问题: 确保命令路径正确
音频质量问题: 尝试调整采样率（默认：16000）

使用教程

使用依赖

Python 3.12+
音频输入设备（麦克风）

安装教程

# 从源代码安装
git clone https://github.com/DefiBax/voice-recorder-mcp.git
cd voice-recorder-mcp
pip install -e .

调试方式

# 使用默认设置运行（base.en模型）
voice-recorder-mcp

# 使用特定Whisper模型运行
voice-recorder-mcp --model medium.en

# 调整采样率
voice-recorder-mcp --sample-rate 44100

使用MCP Inspector测试

# 安装MCP Inspector
npm install -g @modelcontextprotocol/inspector

# 使用检查器运行服务器
npx @modelcontextprotocol/inspector voice-recorder-mcp

与Goose AI代理集成

打开Goose，进入设置 > 扩展 > 添加 > 命令行扩展
将名称设置为voice-recorder
在命令字段中，输入voice-recorder-mcp可执行文件的完整路径
无需环境变量即可实现基本功能
与Goose开始对话并引入录音器

许可证

该项目遵循 MIT 开源许可条款，请参阅 MIT 了解完整条款。