mcp-hfspace MCP Server 🤗

mcp-hfspace MCP Server 🤗

site icon
2025.01.31 0
图像生成文本转语音语音转文本视觉模型聊天模型内容生成开发效率
mcp-hfspace 是一个 MCP 服务器,用于连接 Hugging Face Spaces,提供图像生成、文本转语音、语音转文本、视觉模型等多种功能。它支持通过简单的配置快速接入各种 Hugging Face Spaces,并支持私有空间的使用。适用于需要快速集成 AI 模型能力的开发者和用户。
View on GitHub

Overview

基本能力

产品定位

mcp-hfspace 是一个 MCP 服务器,用于连接 Hugging Face Spaces,提供多种 AI 模型能力,包括图像生成、文本转语音、语音转文本、视觉模型等。

核心功能

  1. 图像生成:支持多种图像生成模型,如 shuttleai/shuttle-3.1-aestheticblack-forest-labs/FLUX.1-schnell
  2. 文本转语音:支持多种文本转语音模型,如 parler-tts/parler_tts
  3. 语音转文本:支持多种语音转文本模型,如 hf-audio/whisper-large-v3-turbo
  4. 视觉模型:支持多种视觉模型,如 microsoft/OmniParsermerve/paligemma2-vqav2
  5. 聊天模型:支持多种聊天模型,如 Qwen/Qwen2.5-72B-Instruct
  6. 文件处理:支持文件上传和下载,并可以指定工作目录。
  7. 私有空间支持:支持通过 Hugging Face Token 访问私有空间。

适用场景

  1. 图像生成:用于生成艺术作品、设计素材等。
  2. 文本转语音:用于生成语音内容,如播客、语音助手等。
  3. 语音转文本:用于语音识别,如会议记录、语音笔记等。
  4. 视觉模型:用于图像分析、物体识别等。
  5. 聊天模型:用于对话系统、客服机器人等。
  6. 文件处理:用于管理生成的文件,如图片、音频等。

工具列表

  1. 图像生成工具:如 shuttleai/shuttle-3.1-aestheticblack-forest-labs/FLUX.1-schnell
  2. 文本转语音工具:如 parler-tts/parler_tts
  3. 语音转文本工具:如 hf-audio/whisper-large-v3-turbo
  4. 视觉工具:如 microsoft/OmniParsermerve/paligemma2-vqav2
  5. 聊天工具:如 Qwen/Qwen2.5-72B-Instruct

常见问题解答

  1. Endpoints with unnamed parameters:目前不支持具有未命名参数的端点。
  2. Claude Desktop 超时:Claude Desktop 使用硬超时值 60 秒,可能导致大型任务超时。
  3. HuggingFace Spaces 配额:如果 ZeroGPU 配额或队列过长,可以尝试复制空间或减少配额请求。

使用教程

使用依赖

  1. 安装最新版本的 NodeJS

安装教程

  1. claude_desktop_config.json 文件的 mcpServers 部分添加以下配置:
    "mcp-hfspace": {
      "command": "npx",
      "args": [
        "-y",
        "@llmindset/mcp-hfspace"
      ]
    }
  1. 确保使用 Claude Desktop 0.78 或更高版本。

调试方式

  1. 使用 --work-dir=/your_directory 参数或 MCP_HF_WORK_DIR 环境变量指定工作目录。
  2. 使用 --hf-token=hf_... 参数或 HF_TOKEN 环境变量指定 Hugging Face Token。
  3. 使用 --desktop-mode=falseCLAUDE_DESKTOP_MODE=false 禁用 Claude Desktop 模式。

标签信息

安装类型

sse

产品定位

图像生成, 文本转语音, 语音转文本, 视觉模型, 聊天模型

归类信息

内容生成, 开发效率

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。