
mcp-hfspace MCP Server 🤗

2025.01.31
0
图像生成文本转语音语音转文本视觉模型聊天模型内容生成开发效率
mcp-hfspace 是一个 MCP 服务器,用于连接 Hugging Face Spaces,提供图像生成、文本转语音、语音转文本、视觉模型等多种功能。它支持通过简单的配置快速接入各种 Hugging Face Spaces,并支持私有空间的使用。适用于需要快速集成 AI 模型能力的开发者和用户。
View on GitHub
Overview
基本能力
产品定位
mcp-hfspace 是一个 MCP 服务器,用于连接 Hugging Face Spaces,提供多种 AI 模型能力,包括图像生成、文本转语音、语音转文本、视觉模型等。
核心功能
- 图像生成:支持多种图像生成模型,如
shuttleai/shuttle-3.1-aesthetic
和black-forest-labs/FLUX.1-schnell
。 - 文本转语音:支持多种文本转语音模型,如
parler-tts/parler_tts
。 - 语音转文本:支持多种语音转文本模型,如
hf-audio/whisper-large-v3-turbo
。 - 视觉模型:支持多种视觉模型,如
microsoft/OmniParser
和merve/paligemma2-vqav2
。 - 聊天模型:支持多种聊天模型,如
Qwen/Qwen2.5-72B-Instruct
。 - 文件处理:支持文件上传和下载,并可以指定工作目录。
- 私有空间支持:支持通过 Hugging Face Token 访问私有空间。
适用场景
- 图像生成:用于生成艺术作品、设计素材等。
- 文本转语音:用于生成语音内容,如播客、语音助手等。
- 语音转文本:用于语音识别,如会议记录、语音笔记等。
- 视觉模型:用于图像分析、物体识别等。
- 聊天模型:用于对话系统、客服机器人等。
- 文件处理:用于管理生成的文件,如图片、音频等。
工具列表
- 图像生成工具:如
shuttleai/shuttle-3.1-aesthetic
、black-forest-labs/FLUX.1-schnell
。 - 文本转语音工具:如
parler-tts/parler_tts
。 - 语音转文本工具:如
hf-audio/whisper-large-v3-turbo
。 - 视觉工具:如
microsoft/OmniParser
、merve/paligemma2-vqav2
。 - 聊天工具:如
Qwen/Qwen2.5-72B-Instruct
。
常见问题解答
- Endpoints with unnamed parameters:目前不支持具有未命名参数的端点。
- Claude Desktop 超时:Claude Desktop 使用硬超时值 60 秒,可能导致大型任务超时。
- HuggingFace Spaces 配额:如果 ZeroGPU 配额或队列过长,可以尝试复制空间或减少配额请求。
使用教程
使用依赖
- 安装最新版本的 NodeJS。
安装教程
- 在
claude_desktop_config.json
文件的mcpServers
部分添加以下配置:
"mcp-hfspace": {
"command": "npx",
"args": [
"-y",
"@llmindset/mcp-hfspace"
]
}
- 确保使用 Claude Desktop 0.78 或更高版本。
调试方式
- 使用
--work-dir=/your_directory
参数或MCP_HF_WORK_DIR
环境变量指定工作目录。 - 使用
--hf-token=hf_...
参数或HF_TOKEN
环境变量指定 Hugging Face Token。 - 使用
--desktop-mode=false
或CLAUDE_DESKTOP_MODE=false
禁用 Claude Desktop 模式。
标签信息
安装类型
sse
产品定位
图像生成
, 文本转语音
, 语音转文本
, 视觉模型
, 聊天模型
归类信息
内容生成
, 开发效率