Resemble AI Voice Generation MCP Server

Resemble AI Voice Generation MCP Server

site icon
2025.03.07 0
Python语音生成文本转语音内容生成
Resemble AI Voice Generation MCP Server 是一个基于 Resemble AI 语音生成 API 的服务实现,通过 Model Context Protocol (MCP) 与 Claude 和 Cursor 集成。该服务主要用于将文本转换为语音,支持多种连接方式和语音模型。
View on GitHub

Overview

基本能力

产品定位

Resemble AI Voice Generation MCP Server 是一个语音生成服务,通过集成 Resemble AI 的 API,提供文本到语音的转换功能,并支持与 Claude 和 Cursor 的集成。

核心功能

  • 使用 Resemble AI 的语音模型将文本转换为语音音频
  • 列出可用的语音模型
  • 支持将音频返回为本地文件或 base64 编码字符串
  • 多种连接方式:
  • SSE Transport - 基于网络的 Server-Sent Events(默认)
  • StdIO Transport - 直接进程通信

适用场景

  • 需要将文本转换为语音的应用
  • 与 Claude 或 Cursor 集成的语音生成需求
  • 需要灵活连接方式的语音生成服务

工具列表

  • list_voices: 列出可用的语音模型
  • generate_tts: 从文本生成语音音频
  • 参数:
    • text: 要转换为语音的文本
    • voice_id: 使用的语音 ID
    • return_type: 返回音频的方式:'file' 或 'base64'(可选,默认:'file')
    • output_filename: 输出文件名(可选)

常见问题解答

  • MCP SDK 导入错误:如果遇到导入问题,服务会自动回退到 HTTP 实现
  • 连接问题:检查服务器是否运行,URL 是否正确配置,API 密钥是否有效
  • StdIO vs. SSE Transport
  • 使用 SSE Transport 当你想单独运行服务器或在不同的机器上运行
  • 使用 StdIO Transport 当你希望 Claude/Cursor 为你管理服务器进程

使用教程

使用依赖

  • Python 3.10 或更高版本
  • Resemble AI API 密钥(在 Resemble AI 注册)

安装教程

使用 Conda(推荐)

# 运行设置脚本
./scripts/setup_environment.sh

# 激活环境
conda activate resemble_mcp

使用虚拟环境

# 运行设置脚本
./scripts/setup_venv.sh

# 激活环境
source venv/bin/activate

配置

设置 Resemble AI API 密钥作为环境变量:

export RESEMBLE_API_KEY="your_api_key_here"

或者,在项目根目录创建 .env 文件:

RESEMBLE_API_KEY=your_api_key_here

运行服务器

使用运行脚本(推荐)

# 使用 SSE transport 运行 MCP SDK 实现(默认)
./run_server.sh mcp 8083

# 运行 HTTP 实现
./run_server.sh http 8083

# 使用 StdIO transport 运行
./run_server.sh stdio

直接使用 CLI

# 使用 SSE transport 运行 MCP SDK 实现
python -m src.cli --implementation mcp --port 8083

# 使用 StdIO transport 运行
python -m src.cli --implementation stdio

调试方式

  • 检查服务器是否运行
  • 验证 URL 是否正确配置
  • 检查 API 密钥是否有效
  • 查看服务器日志中的错误

许可证

该项目遵循 MIT 开源许可条款。