
Resemble AI Voice Generation MCP Server

2025.03.07
0
Python语音生成文本转语音内容生成
Resemble AI Voice Generation MCP Server 是一个基于 Resemble AI 语音生成 API 的服务实现,通过 Model Context Protocol (MCP) 与 Claude 和 Cursor 集成。该服务主要用于将文本转换为语音,支持多种连接方式和语音模型。
View on GitHub
Overview
基本能力
产品定位
Resemble AI Voice Generation MCP Server 是一个语音生成服务,通过集成 Resemble AI 的 API,提供文本到语音的转换功能,并支持与 Claude 和 Cursor 的集成。
核心功能
- 使用 Resemble AI 的语音模型将文本转换为语音音频
- 列出可用的语音模型
- 支持将音频返回为本地文件或 base64 编码字符串
- 多种连接方式:
- SSE Transport - 基于网络的 Server-Sent Events(默认)
- StdIO Transport - 直接进程通信
适用场景
- 需要将文本转换为语音的应用
- 与 Claude 或 Cursor 集成的语音生成需求
- 需要灵活连接方式的语音生成服务
工具列表
list_voices
: 列出可用的语音模型generate_tts
: 从文本生成语音音频- 参数:
text
: 要转换为语音的文本voice_id
: 使用的语音 IDreturn_type
: 返回音频的方式:'file' 或 'base64'(可选,默认:'file')output_filename
: 输出文件名(可选)
常见问题解答
- MCP SDK 导入错误:如果遇到导入问题,服务会自动回退到 HTTP 实现
- 连接问题:检查服务器是否运行,URL 是否正确配置,API 密钥是否有效
- StdIO vs. SSE Transport:
- 使用 SSE Transport 当你想单独运行服务器或在不同的机器上运行
- 使用 StdIO Transport 当你希望 Claude/Cursor 为你管理服务器进程
使用教程
使用依赖
- Python 3.10 或更高版本
- Resemble AI API 密钥(在 Resemble AI 注册)
安装教程
使用 Conda(推荐)
# 运行设置脚本
./scripts/setup_environment.sh
# 激活环境
conda activate resemble_mcp
使用虚拟环境
# 运行设置脚本
./scripts/setup_venv.sh
# 激活环境
source venv/bin/activate
配置
设置 Resemble AI API 密钥作为环境变量:
export RESEMBLE_API_KEY="your_api_key_here"
或者,在项目根目录创建 .env
文件:
RESEMBLE_API_KEY=your_api_key_here
运行服务器
使用运行脚本(推荐)
# 使用 SSE transport 运行 MCP SDK 实现(默认)
./run_server.sh mcp 8083
# 运行 HTTP 实现
./run_server.sh http 8083
# 使用 StdIO transport 运行
./run_server.sh stdio
直接使用 CLI
# 使用 SSE transport 运行 MCP SDK 实现
python -m src.cli --implementation mcp --port 8083
# 使用 StdIO transport 运行
python -m src.cli --implementation stdio
调试方式
- 检查服务器是否运行
- 验证 URL 是否正确配置
- 检查 API 密钥是否有效
- 查看服务器日志中的错误