Voice Call MCP Server

Voice Call MCP Server

site icon
2025.04.15 19
TypeScript语音通话AI助手交流协作
Voice Call MCP Server 是一个基于 Model Context Protocol (MCP) 的服务,它允许 Claude 和其他 AI 助手通过 Twilio 和 OpenAI(GPT-4o Realtime 模型)发起和管理语音通话。该服务为开发者提供了一个基础框架,用于快速启动 AI 驱动的语音通话功能,并在此基础上扩展更多功能。
View on GitHub

Overview

基本能力

产品定位

Voice Call MCP Server 是一个用于 AI 驱动的语音通话的服务,旨在通过 MCP 协议连接 AI 助手和现实世界的语音通话功能。

核心功能

  • 通过 Twilio 发起外拨电话
  • 使用 GPT-4o Realtime 模型实时处理通话音频
  • 通话中实时切换语言
  • 预置常见通话场景的提示词(如餐厅预订)
  • 使用 ngrok 自动创建公共 URL 隧道
  • 安全的凭证处理

适用场景

  • 会议迟到通知
  • 餐厅预订
  • 预约改期
  • 其他需要语音通话的 AI 助手场景

工具列表

  • Twilio:用于发起和管理语音通话
  • OpenAI GPT-4o Realtime:用于实时处理通话音频
  • ngrok:用于创建公共 URL 隧道以便 Twilio 回调

常见问题解答

  1. 电话号码格式错误:确保电话号码以 "+" 开头并包含国家代码
  2. 凭证无效:检查 Twilio 和 OpenAI 的 API 密钥是否正确
  3. OpenAI API 错误:确认 API 密钥有效且有足够余额
  4. Ngrok 隧道启动失败:检查 NGROK_AUTHTOKEN 是否有效
  5. 语音输入检测问题:可能是编码问题,尝试更换接收方

使用教程

使用依赖

  • Node.js >= 22 bash nvm install 22 nvm use 22
  • Twilio 账户和 API 凭证
  • OpenAI API 密钥
  • Ngrok Authtoken

安装教程

  1. 克隆仓库 bash git clone https://github.com/lukaskai/voice-call-mcp-server.git cd voice-call-mcp-server
  2. 安装依赖并构建 bash npm install npm run build

调试方式

  1. 配置环境变量(TWILIO_ACCOUNT_SID, TWILIO_AUTH_TOKEN, TWILIO_NUMBER, OPENAI_API_KEY, NGROK_AUTHTOKEN)
  2. 启动服务
  3. 通过 Claude 发起测试通话

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。