
Gemini Imagen 3.0 MCP Server

2025.04.16
0
TypeScript图像生成AIGoogle AIMCP内容生成
Gemini Imagen 3.0 MCP Server 是一个专业的模型上下文协议(MCP)服务器实现,通过 Gemini API 利用 Google 的 Imagen 3.0 模型进行高质量图像生成。该服务器使用 TypeScript 构建,设计用于与 Claude Desktop 和其他 MCP 兼容主机无缝集成。
View on GitHub
Overview
🌟 核心功能
- 通过 Gemini API 利用 Google 的先进 Imagen 3.0 模型
- 每次请求可生成最多 4 张高质量图像
- 自动文件管理,智能命名
- 支持 file:// 协议的 HTML 预览生成
- 基于 MCP 协议,兼容 AI 代理
- TypeScript 实现,具有强大的错误处理能力
🚀 使用教程
使用依赖
- Node.js 18 或更高版本
- Google Gemini API 密钥
- Claude Desktop 或其他 MCP 兼容主机
安装教程
- 克隆仓库:
git clone https://github.com/yourusername/gemini-imagen-mcp-server.git
cd gemini-imagen-mcp-server
- 安装依赖:
npm install
- 构建 TypeScript 代码:
npm run build
配置
- 配置 Claude Desktop,在
claude_desktop_config.json
中添加:
{
"mcpServers": {
"gemini-image-gen": {
"command": "node",
"args": ["./build/index.js"],
"cwd": "<path-to-project-directory>",
"env": {
"GEMINI_API_KEY": "your-gemini-api-key"
}
}
}
}
- 替换占位符:
<path-to-project-directory>
: 项目路径your-gemini-api-key
: Gemini API 密钥
🛠️ 可用工具
1. generate_images
使用 Google 的 Imagen 3.0 模型生成图像。
参数:
- prompt
(必填): 要生成的图像的文本描述
- numberOfImages
(可选): 图像数量 (1-4, 默认: 1)
文件管理:
- 图像自动保存在 G:\image-gen3-google-mcp-server\images
- 文件名格式:{sanitized-prompt}-{timestamp}-{index}.png
- 时间戳确保文件名唯一
- 提示文本经过处理以确保文件系统安全
示例:
Generate an image of a futuristic city at night
2. create_image_html
为生成的图像创建 HTML 预览标签。
参数:
- imagePaths
(必填): 图像文件路径数组
- width
(可选): 图像宽度(像素,默认: 512)
- height
(可选): 图像高度(像素,默认: 512)
返回带有本地查看的绝对 file:// URL 的 HTML 标签。
示例:
Create HTML tags for the generated images with width=400
🔧 调试方式
# 安装依赖
npm install
# 构建 TypeScript
npm run build
# 运行测试(如果可用)
pm test
📝 常见问题解答
- 错误代码
tool_not_found
(1): 请求的工具不可用 - 错误代码
execution_error
(2): 图像生成或 HTML 创建失败