
YouTube Vision MCP Server (youtube-vision)

2025.04.04
2
JavaScript视频分析内容摘要信息提取内容生成
YouTube Vision MCP Server 是一个基于 Google Gemini Vision API 的 MCP(Model Context Protocol)服务器,主要用于与 YouTube 视频进行交互。它能够获取视频描述、生成摘要、回答关于视频的问题以及提取视频中的关键时刻。
View on GitHub
Overview
基本能力
产品定位
YouTube Vision MCP Server 是一个利用 Google Gemini Vision API 与 YouTube 视频交互的工具,旨在提供视频内容分析和信息提取功能。
核心功能
- 使用 Gemini Vision API 分析 YouTube 视频
- 提供多种工具进行不同交互:
- 通用描述或问答 (
ask_about_youtube_video
) - 摘要生成 (
summarize_youtube_video
) - 关键时刻提取 (
extract_key_moments
) - 列出支持
generateContent
的 Gemini 模型 - 可通过环境变量配置 Gemini 模型
- 通过 stdio(标准输入/输出)进行通信
适用场景
- 视频内容分析
- 视频摘要生成
- 视频关键点提取
- 视频问答系统
工具列表
ask_about_youtube_video
:回答关于视频的问题或提供一般描述summarize_youtube_video
:生成视频摘要extract_key_moments
:提取视频中的关键时刻list_supported_models
:列出支持的 Gemini 模型
常见问题解答
- 模型选择:确保选择适合生产使用的稳定版本模型
- API 使用条款:用户需遵守 Google APIs 和 Gemini API 的使用条款
- 内容责任:生成的准确性和适当性不保证,使用前需谨慎
使用教程
使用依赖
- Node.js:版本 18 或更高
- Google Gemini API Key:从 Google AI Studio 或 Google Cloud Console 获取
安装教程
通过 Smithery 安装
npx -y @smithery/cli install @minbang930/youtube-vision-mcp --client claude
使用 npx(推荐)
在 MCP 客户端设置文件中配置:
{
"mcpServers": {
"youtube-vision": {
"command": "npx",
"args": [
"-y",
"youtube-vision"
],
"env": {
"GEMINI_API_KEY": "YOUR_GEMINI_API_KEY",
"GEMINI_MODEL_NAME": "gemini-2.0-flash"
}
}
}
}
手动安装
- 克隆仓库
git clone https://github.com/minbang930/Youtube-Vision-MCP.git
cd youtube-vision
- 安装依赖
npm install
- 构建项目
npm run build
- 运行
node dist/index.js
调试方式
- 确保
GEMINI_API_KEY
环境变量已设置 - 检查 MCP 客户端配置是否正确
- 运行
node dist/index.js
并查看输出