Voice Call MCP Server

Voice Call MCP Server

site icon
2025.04.15 15
TypeScript语音通话AI 助手集成交流协作
Voice Call MCP Server 是一个基于 Model Context Protocol (MCP) 的服务,它允许 Claude 和其他 AI 助手通过 Twilio 和 OpenAI 发起和管理语音通话。该服务器为开发者提供了一个基础框架,可以快速启动 AI 驱动的语音通话探索,节省时间并在此基础上开发额外功能。
View on GitHub

Overview

基本能力

产品定位

Voice Call MCP Server 是一个 AI 驱动的语音通话服务,旨在通过 MCP 协议连接 AI 助手和现实世界的语音通话功能。

核心功能

  • 通过 Twilio 发起外拨电话
  • 使用 OpenAI 实时处理通话音频
  • 提供常见通话场景的预构建提示(如餐厅预订)
  • 使用 ngrok 自动建立公共 URL 隧道
  • 安全的凭据处理

适用场景

  • AI 助手代表用户发起电话呼叫
  • 处理实时音频对话
  • 执行需要语音通信的复杂任务

工具列表

  • Twilio:用于发起和管理电话呼叫
  • OpenAI:用于实时音频处理和语音生成
  • ngrok:用于自动建立公共 URL 隧道

常见问题解答

  1. "Phone number must be in E.164 format":确保电话号码以"+"和国家代码开头
  2. "Invalid credentials":检查 TWILIO_ACCOUNT_SID 和 TWILIO_AUTH_TOKEN 是否正确
  3. "OpenAI API error":验证 OPENAI_API_KEY 是否正确且有足够余额
  4. "Ngrok tunnel failed to start":确保 NGROK_AUTHTOKEN 有效且未过期
  5. "OpenAI Realtime does not detect the end of voice input, or is lagging.":尝试使用不同的接收方

使用教程

使用依赖

  • Node.js >= 22 bash nvm install 22 nvm use 22
  • Twilio 账户和 API 凭据
  • OpenAI API 密钥
  • Ngrok Authtoken

安装教程

  1. 克隆仓库 bash git clone https://github.com/lukaskai/voice-call-mcp-server.git cd voice-call-mcp-server
  2. 安装依赖并构建 bash npm install npm run build

调试方式

配置环境变量后,可以通过 Claude Desktop 进行测试,确保 Voice Call 出现在 🔨 菜单下。

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。