
Gemini Imagen 3.0 MCP Server

2025.04.15
0
TypeScript图像生成AI集成内容生成
Gemini Imagen 3.0 MCP Server 是一个专业的模型上下文协议(MCP)服务器实现,利用Google的Imagen 3.0模型通过Gemini API进行高质量的图像生成。该服务器基于TypeScript构建,设计用于与Claude Desktop和其他MCP兼容主机无缝集成。
View on GitHub
Overview
🌟 核心功能
- 通过Gemini API利用Google的先进Imagen 3.0模型
- 每个请求生成最多4张高质量图像
- 自动文件管理,智能命名
- 支持HTML预览生成,支持file://协议
- 基于MCP协议,兼容AI代理
- TypeScript实现,具有强大的错误处理能力
🚀 适用场景
- 需要高质量图像生成的AI应用
- 与Claude Desktop或其他MCP兼容主机的集成
- 开发需要图像生成功能的TypeScript项目
🛠️ 工具列表
1. generate_images
使用Google的Imagen 3.0模型生成图像。
参数:
- prompt
(必填): 要生成的图像的文本描述
- numberOfImages
(可选): 图像数量(1-4,默认: 1)
文件管理:
- 图像自动保存在G:\image-gen3-google-mcp-server\images
- 文件名遵循模式: {sanitized-prompt}-{timestamp}-{index}.png
- 时间戳确保文件名唯一
- 提示文本经过清理以确保文件系统安全
示例:
Generate an image of a futuristic city at night
2. create_image_html
为生成的图像创建HTML预览标签。
参数:
- imagePaths
(必填): 图像文件路径数组
- width
(可选): 图像宽度(像素,默认: 512)
- height
(可选): 图像高度(像素,默认: 512)
返回带有绝对file:// URL的HTML标签,用于本地查看。
示例:
Create HTML tags for the generated images with width=400
📝 常见问题解答
- 错误代码1 (
tool_not_found
): 请求的工具不可用 - 错误代码2 (
execution_error
): 图像生成或HTML创建失败
🚀 使用教程
使用依赖
- Node.js 18或更高版本
- Google Gemini API密钥
- Claude Desktop或其他MCP兼容主机
安装教程
- 克隆仓库:
git clone https://github.com/yourusername/gemini-imagen-mcp-server.git
cd gemini-imagen-mcp-server
- 安装依赖:
npm install
- 构建TypeScript代码:
npm run build
调试方式
- 配置Claude Desktop,在
claude_desktop_config.json
中添加:
{
"mcpServers": {
"gemini-image-gen": {
"command": "node",
"args": ["./build/index.js"],
"cwd": "<path-to-project-directory>",
"env": {
"GEMINI_API_KEY": "your-gemini-api-key"
}
}
}
}
- 替换占位符:
<path-to-project-directory>
: 项目路径your-gemini-api-key
: Gemini API密钥
🔧 开发
# 安装依赖
npm install
# 构建TypeScript
npm run build
# 运行测试(如果可用)
npm test