
OpenAI Speech-to-Text transcriptions MCP Server

2025.03.26
4
JavaScript音频转录语音转文本内容生成
audio-transcriber-mcp 是一个基于 OpenAI API 的音频转录服务,提供将音频文件转换为文本的功能。该服务适用于需要将语音内容快速转换为文本的场景,如会议记录、访谈转录、语音笔记等。
View on GitHub
Overview
基本能力
产品定位
audio-transcriber-mcp 是一个音频转录服务,利用 OpenAI 的语音转文本技术,提供高效的音频内容转换功能。
核心功能
- 支持音频文件的转录,将语音内容转换为文本。
- 提供可选的参数配置,如保存转录结果到文件、指定语言等。
适用场景
- 会议记录:快速将会议录音转换为文本。
- 访谈转录:将访谈内容转换为可编辑的文本格式。
- 语音笔记:将语音笔记转换为文本以便后续整理。
工具列表
transcribe_audio
:使用 OpenAI API 转录音频文件。- 必选参数:文件路径。
- 可选参数:
save_to_file
:布尔值,决定是否将转录结果保存到文件。language
:ISO-639-1 语言代码(如 "en"、"es")。
常见问题解答
- 如何设置 OpenAI API 密钥?
在环境变量中设置
OPENAI_API_KEY
。 - 是否支持自定义 OpenAI 基础 URL 和模型?
是的,通过设置
OPENAI_BASE_URL
和OPENAI_MODEL
环境变量可选配置。
使用教程
使用依赖
- 确保已安装 Node.js 和 npm。
- 克隆仓库并安装依赖:
git clone https://github.com/Ichigo3766/audio-transcriber-mcp.git
cd audio-transcriber-mcp
npm install
安装教程
- 构建服务器:
npm run build
- 设置 OpenAI API 密钥和其他可选环境变量。
- 配置服务器路径和环境变量:
{
"mcpServers": {
"audio-transcriber": {
"command": "node",
"args": [
"/path/to/audio-transcriber-mcp/build/index.js"
],
"env": {
"OPENAI_API_KEY": "",
"OPENAI_BASE_URL": "",
"OPENAI_MODEL": ""
}
}
}
}
调试方式
- 确保服务器已正确启动。
- 使用
transcribe_audio
工具测试音频转录功能。 - 检查转录结果是否符合预期。