OpenAI Speech-to-Text transcriptions MCP Server

OpenAI Speech-to-Text transcriptions MCP Server

site icon
2025.03.26 4
JavaScript音频转录语音转文本内容生成
audio-transcriber-mcp 是一个基于 OpenAI API 的音频转录服务,提供将音频文件转换为文本的功能。该服务适用于需要将语音内容快速转换为文本的场景,如会议记录、访谈转录、语音笔记等。
View on GitHub

Overview

基本能力

产品定位

audio-transcriber-mcp 是一个音频转录服务,利用 OpenAI 的语音转文本技术,提供高效的音频内容转换功能。

核心功能

  • 支持音频文件的转录,将语音内容转换为文本。
  • 提供可选的参数配置,如保存转录结果到文件、指定语言等。

适用场景

  • 会议记录:快速将会议录音转换为文本。
  • 访谈转录:将访谈内容转换为可编辑的文本格式。
  • 语音笔记:将语音笔记转换为文本以便后续整理。

工具列表

  • transcribe_audio:使用 OpenAI API 转录音频文件。
  • 必选参数:文件路径。
  • 可选参数:
    • save_to_file:布尔值,决定是否将转录结果保存到文件。
    • language:ISO-639-1 语言代码(如 "en"、"es")。

常见问题解答

  • 如何设置 OpenAI API 密钥? 在环境变量中设置 OPENAI_API_KEY
  • 是否支持自定义 OpenAI 基础 URL 和模型? 是的,通过设置 OPENAI_BASE_URLOPENAI_MODEL 环境变量可选配置。

使用教程

使用依赖

  1. 确保已安装 Node.js 和 npm。
  2. 克隆仓库并安装依赖:
git clone https://github.com/Ichigo3766/audio-transcriber-mcp.git
cd audio-transcriber-mcp
npm install

安装教程

  1. 构建服务器:
npm run build
  1. 设置 OpenAI API 密钥和其他可选环境变量。
  2. 配置服务器路径和环境变量:
{
  "mcpServers": {
    "audio-transcriber": {
      "command": "node",
      "args": [
        "/path/to/audio-transcriber-mcp/build/index.js"
      ],
      "env": {
        "OPENAI_API_KEY": "",
        "OPENAI_BASE_URL": "",
        "OPENAI_MODEL": ""
      }
    }
  }
}

调试方式

  1. 确保服务器已正确启动。
  2. 使用 transcribe_audio 工具测试音频转录功能。
  3. 检查转录结果是否符合预期。

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。