
openai-gpt-image-mcp

2025.04.29
10
TypeScript图像生成图像编辑内容生成
openai-gpt-image-mcp 是一个基于 Model Context Protocol (MCP) 的工具服务器,专门用于 OpenAI 的 GPT-4o/gpt-image-1 图像生成和编辑 API。它提供了从文本提示生成图像、编辑图像(如修复、扩展、合成)等功能,并支持多种 MCP 兼容客户端。
View on GitHub
Overview
基本能力
产品定位
openai-gpt-image-mcp 是一个专门用于图像生成和编辑的工具服务器,通过 OpenAI 的先进模型提供高质量的图像处理能力。
核心功能
- 图像生成:根据文本提示生成图像,支持多种高级选项(如大小、质量、背景等)。
- 图像编辑:通过文本提示和可选掩码编辑或扩展图像,支持文件路径和 base64 输入。
- 文件输出:生成的图像可以直接保存到磁盘,或以 base64 格式返回。
适用场景
- 需要快速生成高质量图像的开发者或设计师。
- 需要对现有图像进行编辑或扩展的应用场景。
- 支持多种 MCP 兼容客户端,如 Claude Desktop、VSCode、Cursor、Windsurf 等。
工具列表
- create-image:从文本提示生成图像。
- edit-image:编辑或扩展图像。
常见问题解答
- 确保
OPENAI_API_KEY
有效且具有图像 API 访问权限。 - 文件路径必须为绝对路径。
- 大文件(超过 1MB)会自动保存到磁盘,避免 base64 返回时的限制。
使用教程
使用依赖
- 需要安装 Node.js 和 yarn。
安装教程
git clone https://github.com/SureScaleAI/openai-gpt-image-mcp.git
cd openai-gpt-image-mcp
yarn install
yarn build
调试方式
- 运行
node dist/index.js
启动服务。 - 确保
OPENAI_API_KEY
已正确配置。 - 检查文件路径和权限设置。
高级配置
- 设置
n
参数可以一次性生成最多 10 张图像。 - 使用
edit-image
时,提供掩码图像以控制编辑区域。 - 通过环境变量
MCP_HF_WORK_DIR
控制大文件的保存路径。