
Speech.sh

2025.03.19
2
Shell文本转语音命令行工具AI 集成内容生成
Speech.sh 是一个强大的命令行工具,用于通过 OpenAI 的 API 将文本转换为语音。它支持多种语音选项、可调节的语音速度、多种 TTS 模型,并具有灵活的 API 密钥管理、自动缓存和强大的重试机制。此外,它还支持 MCP(模型上下文协议)兼容性,可与 AI 助手集成。
View on GitHub
Overview
基本能力
产品定位
Speech.sh 是一个专注于文本到语音转换的命令行工具,旨在提供高效、灵活的语音生成解决方案。
核心功能
- 通过简单命令将文本转换为语音
- 多种语音选项(onyx、alloy、echo、fable、nova、shimmer)
- 可调节的语音速度(0.25 到 4.0)
- 支持 tts-1 和 tts-1-hd 模型
- 灵活的 API 密钥管理(命令行、环境变量或文件)
- 自动缓存以避免重复 API 调用
- 强大的重试机制处理网络问题
- 支持 ffmpeg 和 mplayer 进行音频播放
- MCP(模型上下文协议)兼容性,可与 AI 助手集成
适用场景
- 开发者在命令行中快速生成语音
- 自动化脚本中的语音输出
- AI 助手集成语音功能
- 需要多种语音选项和可调节速度的应用
工具列表
speech.sh
: 主脚本,用于文本到语音转换mcp.sh
: 提供 MCP 兼容性,允许与 MCP 兼容的 AI 助手使用文本到语音功能launch
: 启动 MCP 服务器的脚本
常见问题解答
- 如何启用详细日志记录?
使用
--verbose
标志。 - 如何验证 API 密钥是否有效? 检查 API 密钥是否正确配置。
- 如何验证所有依赖项是否安装? 确保安装了 curl、jq 和 ffmpeg 或 mplayer。
- 如何检查互联网连接? 确保设备已连接到互联网。
- 如何检查输出目录的权限? 确保脚本有权限写入输出目录。
使用教程
使用依赖
确保安装了以下依赖项: - curl - jq - ffmpeg 或 mplayer(推荐 ffmpeg)
安装教程
- 克隆仓库:
bash git clone https://github.com/j3k0/speech.sh.git cd speech.sh
- 使脚本可执行:
bash chmod +x speech.sh mcp.sh launch
调试方式
- 启用详细日志记录:
bash ./speech.sh --text "Hello, world!" --verbose
- 检查依赖项:
bash which curl jq ffmpeg mplayer
- 验证 API 密钥:
bash echo $OPENAI_API_KEY