Speech.sh

Speech.sh

2025.03.19 2

Shell文本转语音命令行工具AI 集成内容生成

Speech.sh 是一个强大的命令行工具，用于通过 OpenAI 的 API 将文本转换为语音。它支持多种语音选项、可调节的语音速度、多种 TTS 模型，并具有灵活的 API 密钥管理、自动缓存和强大的重试机制。此外，它还支持 MCP（模型上下文协议）兼容性，可与 AI 助手集成。

View on GitHub

Overview

基本能力

产品定位

Speech.sh 是一个专注于文本到语音转换的命令行工具，旨在提供高效、灵活的语音生成解决方案。

核心功能

通过简单命令将文本转换为语音
多种语音选项（onyx、alloy、echo、fable、nova、shimmer）
可调节的语音速度（0.25 到 4.0）
支持 tts-1 和 tts-1-hd 模型
灵活的 API 密钥管理（命令行、环境变量或文件）
自动缓存以避免重复 API 调用
强大的重试机制处理网络问题
支持 ffmpeg 和 mplayer 进行音频播放
MCP（模型上下文协议）兼容性，可与 AI 助手集成

适用场景

开发者在命令行中快速生成语音
自动化脚本中的语音输出
AI 助手集成语音功能
需要多种语音选项和可调节速度的应用

工具列表

speech.sh: 主脚本，用于文本到语音转换
mcp.sh: 提供 MCP 兼容性，允许与 MCP 兼容的 AI 助手使用文本到语音功能
launch: 启动 MCP 服务器的脚本

常见问题解答

如何启用详细日志记录？ 使用 --verbose 标志。
如何验证 API 密钥是否有效？ 检查 API 密钥是否正确配置。
如何验证所有依赖项是否安装？ 确保安装了 curl、jq 和 ffmpeg 或 mplayer。
如何检查互联网连接？ 确保设备已连接到互联网。
如何检查输出目录的权限？ 确保脚本有权限写入输出目录。

使用教程

使用依赖

确保安装了以下依赖项： - curl - jq - ffmpeg 或 mplayer（推荐 ffmpeg）

安装教程

克隆仓库： bash git clone https://github.com/j3k0/speech.sh.git cd speech.sh
使脚本可执行： bash chmod +x speech.sh mcp.sh launch

调试方式

启用详细日志记录： bash ./speech.sh --text "Hello, world!" --verbose
检查依赖项： bash which curl jq ffmpeg mplayer
验证 API 密钥： bash echo $OPENAI_API_KEY

许可证

该项目遵循 GPL-3.0 开源许可条款，请参阅 GPL-3.0 了解完整条款。