Gemini Imagen 3.0 MCP Server

Gemini Imagen 3.0 MCP Server

site icon
2025.04.16 0
TypeScript图像生成AIGoogle AIMCP内容生成
Gemini Imagen 3.0 MCP Server 是一个专业的模型上下文协议(MCP)服务器实现,通过 Gemini API 利用 Google 的 Imagen 3.0 模型进行高质量图像生成。该服务器使用 TypeScript 构建,设计用于与 Claude Desktop 和其他 MCP 兼容主机无缝集成。
View on GitHub

Overview

🌟 核心功能

  • 通过 Gemini API 利用 Google 的先进 Imagen 3.0 模型
  • 每次请求可生成最多 4 张高质量图像
  • 自动文件管理,智能命名
  • 支持 file:// 协议的 HTML 预览生成
  • 基于 MCP 协议,兼容 AI 代理
  • TypeScript 实现,具有强大的错误处理能力

🚀 使用教程

使用依赖

  • Node.js 18 或更高版本
  • Google Gemini API 密钥
  • Claude Desktop 或其他 MCP 兼容主机

安装教程

  1. 克隆仓库:
git clone https://github.com/yourusername/gemini-imagen-mcp-server.git
cd gemini-imagen-mcp-server
  1. 安装依赖:
npm install
  1. 构建 TypeScript 代码:
npm run build

配置

  1. 配置 Claude Desktop,在 claude_desktop_config.json 中添加:
{
  "mcpServers": {
    "gemini-image-gen": {
      "command": "node",
      "args": ["./build/index.js"],
      "cwd": "<path-to-project-directory>",
      "env": {
        "GEMINI_API_KEY": "your-gemini-api-key"
      }
    }
  }
}
  1. 替换占位符:
  2. <path-to-project-directory>: 项目路径
  3. your-gemini-api-key: Gemini API 密钥

🛠️ 可用工具

1. generate_images

使用 Google 的 Imagen 3.0 模型生成图像。

参数: - prompt (必填): 要生成的图像的文本描述 - numberOfImages (可选): 图像数量 (1-4, 默认: 1)

文件管理: - 图像自动保存在 G:\image-gen3-google-mcp-server\images - 文件名格式:{sanitized-prompt}-{timestamp}-{index}.png - 时间戳确保文件名唯一 - 提示文本经过处理以确保文件系统安全

示例:

Generate an image of a futuristic city at night

2. create_image_html

为生成的图像创建 HTML 预览标签。

参数: - imagePaths (必填): 图像文件路径数组 - width (可选): 图像宽度(像素,默认: 512) - height (可选): 图像高度(像素,默认: 512)

返回带有本地查看的绝对 file:// URL 的 HTML 标签。

示例:

Create HTML tags for the generated images with width=400

🔧 调试方式

# 安装依赖
npm install

# 构建 TypeScript
npm run build

# 运行测试(如果可用)
pm test

📝 常见问题解答

  • 错误代码 tool_not_found (1): 请求的工具不可用
  • 错误代码 execution_error (2): 图像生成或 HTML 创建失败

许可证

该项目遵循 MIT 开源许可条款。