openai-gpt-image-mcp

openai-gpt-image-mcp

2025.04.29 10

TypeScript图像生成图像编辑内容生成

openai-gpt-image-mcp 是一个基于 Model Context Protocol (MCP) 的工具服务器，专门用于 OpenAI 的 GPT-4o/gpt-image-1 图像生成和编辑 API。它提供了从文本提示生成图像、编辑图像（如修复、扩展、合成）等功能，并支持多种 MCP 兼容客户端。

View on GitHub

Overview

基本能力

产品定位

openai-gpt-image-mcp 是一个专门用于图像生成和编辑的工具服务器，通过 OpenAI 的先进模型提供高质量的图像处理能力。

核心功能

图像生成：根据文本提示生成图像，支持多种高级选项（如大小、质量、背景等）。
图像编辑：通过文本提示和可选掩码编辑或扩展图像，支持文件路径和 base64 输入。
文件输出：生成的图像可以直接保存到磁盘，或以 base64 格式返回。

适用场景

需要快速生成高质量图像的开发者或设计师。
需要对现有图像进行编辑或扩展的应用场景。
支持多种 MCP 兼容客户端，如 Claude Desktop、VSCode、Cursor、Windsurf 等。

工具列表

create-image：从文本提示生成图像。
edit-image：编辑或扩展图像。

常见问题解答

确保 OPENAI_API_KEY 有效且具有图像 API 访问权限。
文件路径必须为绝对路径。
大文件（超过 1MB）会自动保存到磁盘，避免 base64 返回时的限制。

使用教程

使用依赖

需要安装 Node.js 和 yarn。

安装教程

git clone https://github.com/SureScaleAI/openai-gpt-image-mcp.git
cd openai-gpt-image-mcp
yarn install
yarn build

调试方式

运行 node dist/index.js 启动服务。
确保 OPENAI_API_KEY 已正确配置。
检查文件路径和权限设置。

高级配置

设置 n 参数可以一次性生成最多 10 张图像。
使用 edit-image 时，提供掩码图像以控制编辑区域。
通过环境变量 MCP_HF_WORK_DIR 控制大文件的保存路径。

许可证

该项目遵循 MIT 开源许可条款，请参阅 MIT 了解完整条款。