
Voice Call MCP Server

2025.04.15
19
TypeScript语音通话AI助手交流协作
Voice Call MCP Server 是一个基于 Model Context Protocol (MCP) 的服务,它允许 Claude 和其他 AI 助手通过 Twilio 和 OpenAI(GPT-4o Realtime 模型)发起和管理语音通话。该服务为开发者提供了一个基础框架,用于快速启动 AI 驱动的语音通话功能,并在此基础上扩展更多功能。
View on GitHub
Overview
基本能力
产品定位
Voice Call MCP Server 是一个用于 AI 驱动的语音通话的服务,旨在通过 MCP 协议连接 AI 助手和现实世界的语音通话功能。
核心功能
- 通过 Twilio 发起外拨电话
- 使用 GPT-4o Realtime 模型实时处理通话音频
- 通话中实时切换语言
- 预置常见通话场景的提示词(如餐厅预订)
- 使用 ngrok 自动创建公共 URL 隧道
- 安全的凭证处理
适用场景
- 会议迟到通知
- 餐厅预订
- 预约改期
- 其他需要语音通话的 AI 助手场景
工具列表
- Twilio:用于发起和管理语音通话
- OpenAI GPT-4o Realtime:用于实时处理通话音频
- ngrok:用于创建公共 URL 隧道以便 Twilio 回调
常见问题解答
- 电话号码格式错误:确保电话号码以 "+" 开头并包含国家代码
- 凭证无效:检查 Twilio 和 OpenAI 的 API 密钥是否正确
- OpenAI API 错误:确认 API 密钥有效且有足够余额
- Ngrok 隧道启动失败:检查 NGROK_AUTHTOKEN 是否有效
- 语音输入检测问题:可能是编码问题,尝试更换接收方
使用教程
使用依赖
- Node.js >= 22
bash nvm install 22 nvm use 22
- Twilio 账户和 API 凭证
- OpenAI API 密钥
- Ngrok Authtoken
安装教程
- 克隆仓库
bash git clone https://github.com/lukaskai/voice-call-mcp-server.git cd voice-call-mcp-server
- 安装依赖并构建
bash npm install npm run build
调试方式
- 配置环境变量(TWILIO_ACCOUNT_SID, TWILIO_AUTH_TOKEN, TWILIO_NUMBER, OPENAI_API_KEY, NGROK_AUTHTOKEN)
- 启动服务
- 通过 Claude 发起测试通话