
AI Vision MCP Server

2025.03.28
0
JavaScript视觉分析UI/UX分析自动化测试浏览器自动化开发效率
AI Vision MCP Server 是一个基于模型上下文协议(MCP)的服务,为Claude和其他兼容MCP的AI助手提供AI驱动的视觉分析能力。该服务能够通过URL捕获网站截图,分析UI元素、布局和内容,进行文件操作,生成UI/UX分析报告,并支持跨多步分析的调试会话。
View on GitHub
Overview
基本能力
产品定位
AI Vision MCP Server 是一个专为AI助手设计的视觉分析工具,提供从截图捕获到UI/UX分析的全套解决方案。
核心功能
- Screenshot URL: 通过URL捕获网站截图
- Visual Analysis: 分析截图中的UI元素、布局和内容
- File Operations: 精确到行的文件读写操作
- Report Generation: 生成全面的UI/UX分析报告
- Debugging Session: 支持跨多步分析的调试会话
适用场景
- 网站UI/UX分析
- 自动化测试
- 视觉内容分析
- 文件内容管理
工具列表
- screenshot_url: 捕获指定URL的截图
- analyze_screen: 分析最新截图
- read_file: 读取文件指定行内容
- modify_file: 修改文件指定行内容
- generate_report: 生成UI/UX分析报告
常见问题解答
- 依赖要求: Node.js 14+, Playwright, Gemini API key
- 许可证: MIT
使用教程
使用依赖
# 确保已安装Node.js 14+
node --version
# 安装Playwright
npm install playwright
安装教程
# 克隆仓库
git clone https://github.com/samihalawa/mcp-server-ai-vision.git
cd mcp-server-ai-vision
# 安装依赖
npm install
# 构建服务器
npm run build
调试方式
# 启动服务器
npm start
# 测试截图功能
screenshot_url(url: "https://example.com")
# 测试分析功能
analyze_screen()