YouTube Vision MCP Server (youtube-vision)

YouTube Vision MCP Server (youtube-vision)

site icon
2025.04.04 2
JavaScript视频分析内容摘要信息提取内容生成
YouTube Vision MCP Server 是一个基于 Google Gemini Vision API 的 MCP(Model Context Protocol)服务器,主要用于与 YouTube 视频进行交互。它能够获取视频描述、生成摘要、回答关于视频的问题以及提取视频中的关键时刻。
View on GitHub

Overview

基本能力

产品定位

YouTube Vision MCP Server 是一个利用 Google Gemini Vision API 与 YouTube 视频交互的工具,旨在提供视频内容分析和信息提取功能。

核心功能

  • 使用 Gemini Vision API 分析 YouTube 视频
  • 提供多种工具进行不同交互:
  • 通用描述或问答 (ask_about_youtube_video)
  • 摘要生成 (summarize_youtube_video)
  • 关键时刻提取 (extract_key_moments)
  • 列出支持 generateContent 的 Gemini 模型
  • 可通过环境变量配置 Gemini 模型
  • 通过 stdio(标准输入/输出)进行通信

适用场景

  • 视频内容分析
  • 视频摘要生成
  • 视频关键点提取
  • 视频问答系统

工具列表

  1. ask_about_youtube_video:回答关于视频的问题或提供一般描述
  2. summarize_youtube_video:生成视频摘要
  3. extract_key_moments:提取视频中的关键时刻
  4. list_supported_models:列出支持的 Gemini 模型

常见问题解答

  • 模型选择:确保选择适合生产使用的稳定版本模型
  • API 使用条款:用户需遵守 Google APIs 和 Gemini API 的使用条款
  • 内容责任:生成的准确性和适当性不保证,使用前需谨慎

使用教程

使用依赖

  • Node.js:版本 18 或更高
  • Google Gemini API Key:从 Google AI Studio 或 Google Cloud Console 获取

安装教程

通过 Smithery 安装

npx -y @smithery/cli install @minbang930/youtube-vision-mcp --client claude

使用 npx(推荐)

在 MCP 客户端设置文件中配置:

{
  "mcpServers": {
    "youtube-vision": {
      "command": "npx",
      "args": [
        "-y",
        "youtube-vision"
      ],
      "env": {
        "GEMINI_API_KEY": "YOUR_GEMINI_API_KEY",
        "GEMINI_MODEL_NAME": "gemini-2.0-flash"
      }
    }
  }
}

手动安装

  1. 克隆仓库
git clone https://github.com/minbang930/Youtube-Vision-MCP.git
cd youtube-vision
  1. 安装依赖
npm install
  1. 构建项目
npm run build
  1. 运行
node dist/index.js

调试方式

  • 确保 GEMINI_API_KEY 环境变量已设置
  • 检查 MCP 客户端配置是否正确
  • 运行 node dist/index.js 并查看输出

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。