openai-gpt-image-mcp

openai-gpt-image-mcp

site icon
2025.04.29 10
TypeScript图像生成图像编辑内容生成
openai-gpt-image-mcp 是一个基于 Model Context Protocol (MCP) 的工具服务器,专门用于 OpenAI 的 GPT-4o/gpt-image-1 图像生成和编辑 API。它提供了从文本提示生成图像、编辑图像(如修复、扩展、合成)等功能,并支持多种 MCP 兼容客户端。
View on GitHub

Overview

基本能力

产品定位

openai-gpt-image-mcp 是一个专门用于图像生成和编辑的工具服务器,通过 OpenAI 的先进模型提供高质量的图像处理能力。

核心功能

  • 图像生成:根据文本提示生成图像,支持多种高级选项(如大小、质量、背景等)。
  • 图像编辑:通过文本提示和可选掩码编辑或扩展图像,支持文件路径和 base64 输入。
  • 文件输出:生成的图像可以直接保存到磁盘,或以 base64 格式返回。

适用场景

  • 需要快速生成高质量图像的开发者或设计师。
  • 需要对现有图像进行编辑或扩展的应用场景。
  • 支持多种 MCP 兼容客户端,如 Claude Desktop、VSCode、Cursor、Windsurf 等。

工具列表

  • create-image:从文本提示生成图像。
  • edit-image:编辑或扩展图像。

常见问题解答

  • 确保 OPENAI_API_KEY 有效且具有图像 API 访问权限。
  • 文件路径必须为绝对路径。
  • 大文件(超过 1MB)会自动保存到磁盘,避免 base64 返回时的限制。

使用教程

使用依赖

  • 需要安装 Node.js 和 yarn。

安装教程

git clone https://github.com/SureScaleAI/openai-gpt-image-mcp.git
cd openai-gpt-image-mcp
yarn install
yarn build

调试方式

  • 运行 node dist/index.js 启动服务。
  • 确保 OPENAI_API_KEY 已正确配置。
  • 检查文件路径和权限设置。

高级配置

  • 设置 n 参数可以一次性生成最多 10 张图像。
  • 使用 edit-image 时,提供掩码图像以控制编辑区域。
  • 通过环境变量 MCP_HF_WORK_DIR 控制大文件的保存路径。

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。