Speech.sh

Speech.sh

site icon
2025.03.19 2
Shell文本转语音命令行工具AI 集成内容生成
Speech.sh 是一个强大的命令行工具,用于通过 OpenAI 的 API 将文本转换为语音。它支持多种语音选项、可调节的语音速度、多种 TTS 模型,并具有灵活的 API 密钥管理、自动缓存和强大的重试机制。此外,它还支持 MCP(模型上下文协议)兼容性,可与 AI 助手集成。
View on GitHub

Overview

基本能力

产品定位

Speech.sh 是一个专注于文本到语音转换的命令行工具,旨在提供高效、灵活的语音生成解决方案。

核心功能

  • 通过简单命令将文本转换为语音
  • 多种语音选项(onyx、alloy、echo、fable、nova、shimmer)
  • 可调节的语音速度(0.25 到 4.0)
  • 支持 tts-1 和 tts-1-hd 模型
  • 灵活的 API 密钥管理(命令行、环境变量或文件)
  • 自动缓存以避免重复 API 调用
  • 强大的重试机制处理网络问题
  • 支持 ffmpeg 和 mplayer 进行音频播放
  • MCP(模型上下文协议)兼容性,可与 AI 助手集成

适用场景

  • 开发者在命令行中快速生成语音
  • 自动化脚本中的语音输出
  • AI 助手集成语音功能
  • 需要多种语音选项和可调节速度的应用

工具列表

  • speech.sh: 主脚本,用于文本到语音转换
  • mcp.sh: 提供 MCP 兼容性,允许与 MCP 兼容的 AI 助手使用文本到语音功能
  • launch: 启动 MCP 服务器的脚本

常见问题解答

  1. 如何启用详细日志记录? 使用 --verbose 标志。
  2. 如何验证 API 密钥是否有效? 检查 API 密钥是否正确配置。
  3. 如何验证所有依赖项是否安装? 确保安装了 curl、jq 和 ffmpeg 或 mplayer。
  4. 如何检查互联网连接? 确保设备已连接到互联网。
  5. 如何检查输出目录的权限? 确保脚本有权限写入输出目录。

使用教程

使用依赖

确保安装了以下依赖项: - curl - jq - ffmpeg 或 mplayer(推荐 ffmpeg)

安装教程

  1. 克隆仓库: bash git clone https://github.com/j3k0/speech.sh.git cd speech.sh
  2. 使脚本可执行: bash chmod +x speech.sh mcp.sh launch

调试方式

  1. 启用详细日志记录: bash ./speech.sh --text "Hello, world!" --verbose
  2. 检查依赖项: bash which curl jq ffmpeg mplayer
  3. 验证 API 密钥: bash echo $OPENAI_API_KEY

许可证

该项目遵循 GPL-3.0 开源许可条款,请参阅 GPL-3.0 了解完整条款。