OpenAI Speech-to-Text transcriptions MCP Server

OpenAI Speech-to-Text transcriptions MCP Server

2025.03.26 4

JavaScript音频转录语音转文本内容生成

audio-transcriber-mcp 是一个基于 OpenAI API 的音频转录服务，提供将音频文件转换为文本的功能。该服务适用于需要将语音内容快速转换为文本的场景，如会议记录、访谈转录、语音笔记等。

View on GitHub

Overview

基本能力

产品定位

audio-transcriber-mcp 是一个音频转录服务，利用 OpenAI 的语音转文本技术，提供高效的音频内容转换功能。

核心功能

支持音频文件的转录，将语音内容转换为文本。
提供可选的参数配置，如保存转录结果到文件、指定语言等。

适用场景

会议记录：快速将会议录音转换为文本。
访谈转录：将访谈内容转换为可编辑的文本格式。
语音笔记：将语音笔记转换为文本以便后续整理。

工具列表

transcribe_audio：使用 OpenAI API 转录音频文件。
必选参数：文件路径。
可选参数：
- save_to_file：布尔值，决定是否将转录结果保存到文件。
- language：ISO-639-1 语言代码（如 "en"、"es"）。

常见问题解答

如何设置 OpenAI API 密钥？在环境变量中设置 OPENAI_API_KEY。
是否支持自定义 OpenAI 基础 URL 和模型？是的，通过设置 OPENAI_BASE_URL 和 OPENAI_MODEL 环境变量可选配置。

使用教程

使用依赖

确保已安装 Node.js 和 npm。
克隆仓库并安装依赖：

git clone https://github.com/Ichigo3766/audio-transcriber-mcp.git
cd audio-transcriber-mcp
npm install

安装教程

构建服务器：

npm run build

设置 OpenAI API 密钥和其他可选环境变量。
配置服务器路径和环境变量：

{
  "mcpServers": {
    "audio-transcriber": {
      "command": "node",
      "args": [
        "/path/to/audio-transcriber-mcp/build/index.js"
      ],
      "env": {
        "OPENAI_API_KEY": "",
        "OPENAI_BASE_URL": "",
        "OPENAI_MODEL": ""
      }
    }
  }
}

调试方式

确保服务器已正确启动。
使用 transcribe_audio 工具测试音频转录功能。
检查转录结果是否符合预期。

许可证

该项目遵循 MIT 开源许可条款，请参阅 MIT 了解完整条款。