AI Vision MCP Server

AI Vision MCP Server

site icon
2025.03.28 0
JavaScript视觉分析UI/UX分析自动化测试浏览器自动化开发效率
AI Vision MCP Server 是一个基于模型上下文协议(MCP)的服务,为Claude和其他兼容MCP的AI助手提供AI驱动的视觉分析能力。该服务能够通过URL捕获网站截图,分析UI元素、布局和内容,进行文件操作,生成UI/UX分析报告,并支持跨多步分析的调试会话。
View on GitHub

Overview

基本能力

产品定位

AI Vision MCP Server 是一个专为AI助手设计的视觉分析工具,提供从截图捕获到UI/UX分析的全套解决方案。

核心功能

  • Screenshot URL: 通过URL捕获网站截图
  • Visual Analysis: 分析截图中的UI元素、布局和内容
  • File Operations: 精确到行的文件读写操作
  • Report Generation: 生成全面的UI/UX分析报告
  • Debugging Session: 支持跨多步分析的调试会话

适用场景

  • 网站UI/UX分析
  • 自动化测试
  • 视觉内容分析
  • 文件内容管理

工具列表

  1. screenshot_url: 捕获指定URL的截图
  2. analyze_screen: 分析最新截图
  3. read_file: 读取文件指定行内容
  4. modify_file: 修改文件指定行内容
  5. generate_report: 生成UI/UX分析报告

常见问题解答

  • 依赖要求: Node.js 14+, Playwright, Gemini API key
  • 许可证: MIT

使用教程

使用依赖

# 确保已安装Node.js 14+
node --version

# 安装Playwright
npm install playwright

安装教程

# 克隆仓库
git clone https://github.com/samihalawa/mcp-server-ai-vision.git
cd mcp-server-ai-vision

# 安装依赖
npm install

# 构建服务器
npm run build

调试方式

# 启动服务器
npm start

# 测试截图功能
screenshot_url(url: "https://example.com")

# 测试分析功能
analyze_screen()

许可证

该项目遵循 MIT 开源许可条款。