
MCP Video Digest (视频内容提取总结)

2025.04.03
9
Python视频内容处理音频提取文本转录内容生成
MCP Video Digest 是一个视频内容处理服务,能够从 YouTube、Bilibili、TikTok、Twitter 等视频平台中提取音频并转换为文本。该服务支持多个转录服务提供商,包括 Deepgram、Gladia、Speechmatics 和 AssemblyAI,可以根据配置的 API 密钥灵活选择使用。
View on GitHub
Overview
基本能力
产品定位
MCP Video Digest 是一个视频内容处理服务,主要用于从视频中提取音频并转换为文本。
核心功能
- 支持超过1000个网站上的流媒体内容下载和音频提取
- 多个转录服务提供商支持:Deepgram、Gladia、Speechmatics、AssemblyAI
- 灵活的服务选择机制,根据可用的 API 密钥自动选择服务
- 异步处理设计,提高并发性能
- 完整的错误处理和日志记录
- 支持说话人分离
适用场景
- 视频内容摘要生成
- 视频字幕生成
- 视频内容分析
- 多语言转录
工具列表
uv
: 用于依赖管理和虚拟环境管理yt-dlp
: 用于视频下载speechmatics sdk
: 用于语音转录
常见问题解答
- API 密钥缺失或无效
- 视频下载失败
- 音频转录失败
- 网络连接问题
- 服务限制和配额
使用教程
使用依赖
- 安装 uv:
curl -LsSf https://astral.sh/uv/install.sh | sh
安装教程
- 克隆项目:
git clone https://github.com/R-lz/mcp-video-digest.git
cd mcp-video-digest
- 创建并激活虚拟环境:
uv venv
source .venv/bin/activate # Linux/Mac
# 或
.venv\Scripts\activate # Windows
- 安装依赖:
uv pip install -e .
调试方式
- 启动服务:
uv run src/main.py
- 调试模式:
UV_DEBUG=1 uv run src/main.py
- 运行测试脚本:
uv run test.py
# 或
python test.py