Audio MCP Server

Audio MCP Server

site icon
2025.03.14 2
Python音频交互AI助手工具其它
Audio MCP Server 是一个基于 Model Context Protocol (MCP) 的服务器,为 AI 助手(如 Claude)提供音频输入/输出功能。该服务器使 Claude 能够与计算机的音频系统交互,包括从麦克风录音和通过扬声器播放音频。
View on GitHub

Overview

基本能力

产品定位

Audio MCP Server 是一个音频交互工具,旨在为 AI 助手提供音频输入和输出能力,使其能够与用户的音频设备进行交互。

核心功能

  • 列出音频设备:查看系统上所有可用的麦克风和扬声器
  • 录音功能:从任何麦克风捕获音频,可自定义持续时间和质量
  • 播放录音:播放最近的录音
  • 音频文件播放:通过扬声器播放音频文件
  • 文本转语音:(未来实现的功能)

适用场景

  • AI 助手需要与用户进行语音交互
  • 需要录制音频并进行分析或处理
  • 播放音频文件或录音

工具列表

  • list_audio_devices:列出系统上所有可用的音频输入和输出设备
  • record_audio:从麦克风录音
  • 参数:duration(录音时长,默认5秒)、sample_rate(采样率,默认44100 Hz)、channels(音频通道数,默认1)、device_index(输入设备索引,默认系统默认)
  • play_latest_recording:播放最近的录音
  • play_audio:文本转语音(占位功能)
  • 参数:text(要转换的文本)、voice(使用的语音,默认"default")
  • play_audio_file:通过扬声器播放音频文件
  • 参数:file_path(音频文件路径)、device_index(输出设备索引,默认系统默认)

常见问题解答

  • 未找到设备:检查麦克风和扬声器是否连接正确,操作系统是否识别设备,是否有访问音频设备的权限
  • 播放问题:检查音量设置,确保选择了正确的输出设备,尝试重启 Claude Desktop 应用
  • 服务器连接问题:验证配置路径是否正确,确保 Python 和所有依赖项已安装,检查 Claude 的日志以获取错误消息

使用教程

使用依赖

  • Python 3.8 或更高版本
  • 系统上的音频输入/输出设备

安装教程

  1. 克隆仓库或下载文件到计算机:
git clone https://github.com/GongRzhe/Audio-MCP-Server.git
cd Audio-MCP-Server
  1. 创建虚拟环境并安装依赖:
# Windows
python -m venv .venv
.venv\Scripts\activate
pip install -r requirements.txt

# macOS/Linux
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
  1. 或使用包含的设置脚本自动安装:
python setup_mcp.py

调试方式

安装完成后,重启 Claude Desktop。在输入框中应看到一个锤子图标,表示工具可用。

尝试询问 Claude: - "What microphones and speakers are available on my system?" - "Record 5 seconds of audio from my microphone." - "Play back the audio recording." - "Play an audio file from my computer."

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。