
Audio MCP Server

2025.03.14
2
Python音频交互AI助手工具其它
Audio MCP Server 是一个基于 Model Context Protocol (MCP) 的服务器,为 AI 助手(如 Claude)提供音频输入/输出功能。该服务器使 Claude 能够与计算机的音频系统交互,包括从麦克风录音和通过扬声器播放音频。
View on GitHub
Overview
基本能力
产品定位
Audio MCP Server 是一个音频交互工具,旨在为 AI 助手提供音频输入和输出能力,使其能够与用户的音频设备进行交互。
核心功能
- 列出音频设备:查看系统上所有可用的麦克风和扬声器
- 录音功能:从任何麦克风捕获音频,可自定义持续时间和质量
- 播放录音:播放最近的录音
- 音频文件播放:通过扬声器播放音频文件
- 文本转语音:(未来实现的功能)
适用场景
- AI 助手需要与用户进行语音交互
- 需要录制音频并进行分析或处理
- 播放音频文件或录音
工具列表
- list_audio_devices:列出系统上所有可用的音频输入和输出设备
- record_audio:从麦克风录音
- 参数:
duration
(录音时长,默认5秒)、sample_rate
(采样率,默认44100 Hz)、channels
(音频通道数,默认1)、device_index
(输入设备索引,默认系统默认) - play_latest_recording:播放最近的录音
- play_audio:文本转语音(占位功能)
- 参数:
text
(要转换的文本)、voice
(使用的语音,默认"default") - play_audio_file:通过扬声器播放音频文件
- 参数:
file_path
(音频文件路径)、device_index
(输出设备索引,默认系统默认)
常见问题解答
- 未找到设备:检查麦克风和扬声器是否连接正确,操作系统是否识别设备,是否有访问音频设备的权限
- 播放问题:检查音量设置,确保选择了正确的输出设备,尝试重启 Claude Desktop 应用
- 服务器连接问题:验证配置路径是否正确,确保 Python 和所有依赖项已安装,检查 Claude 的日志以获取错误消息
使用教程
使用依赖
- Python 3.8 或更高版本
- 系统上的音频输入/输出设备
安装教程
- 克隆仓库或下载文件到计算机:
git clone https://github.com/GongRzhe/Audio-MCP-Server.git
cd Audio-MCP-Server
- 创建虚拟环境并安装依赖:
# Windows
python -m venv .venv
.venv\Scripts\activate
pip install -r requirements.txt
# macOS/Linux
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
- 或使用包含的设置脚本自动安装:
python setup_mcp.py
调试方式
安装完成后,重启 Claude Desktop。在输入框中应看到一个锤子图标,表示工具可用。
尝试询问 Claude: - "What microphones and speakers are available on my system?" - "Record 5 seconds of audio from my microphone." - "Play back the audio recording." - "Play an audio file from my computer."