
nova-act-mcp

2025.04.18
5
Python浏览器自动化AI助手集成浏览器自动化
nova-act-mcp 是一个基于 Amazon Nova Act SDK 的 MCP 服务器,旨在通过自然语言指令控制网页浏览器,实现交互式浏览器自动化。它作为 Nova Act 浏览器自动化 SDK 和模型上下文协议(MCP)之间的桥梁,允许 AI 助手(如 Claude)通过自然语言指令控制浏览器执行任务,并提供对代理推理过程的透明视图。
View on GitHub
Overview
基本能力
产品定位
nova-act-mcp 是一个浏览器自动化工具,通过 MCP 协议与 AI 助手集成,实现自然语言驱动的网页交互。
核心功能
- 浏览器控制:直接通过 AI 助手控制网页浏览器
- 任务执行:执行交互式浏览器自动化任务
- 会话保持:在交互之间维护浏览器会话
- 透明推理:查看代理的逐步推理过程
- 会话管理:支持启动、执行指令和结束会话
- 持久会话:维护浏览器配置文件,保留登录状态和本地数据
适用场景
- 通过自然语言指令进行网页搜索
- 自动化填写表单和提交数据
- 网页内容抓取和分析
- 多步骤网页操作流程自动化
- 与需要登录的网站交互
工具列表
- nova-browser:主工具,提供浏览器控制能力
- 启动浏览器会话
- 执行自然语言指令
- 结束会话
常见问题解答
- Nova Act API 密钥问题:
- 验证密钥有效性
- 检查配置是否正确
- 尝试设置为环境变量
- 浏览器自动化问题:
- 检查代理思考字段
- 使指令更具体
- 对表单和登录明确字段名称
- 调试模式:设置
NOVA_MCP_DEBUG=1
获取详细诊断信息
使用教程
使用依赖
- Python 3.10 或更高版本
- Amazon Nova Act API 密钥(从 https://nova.amazon.com/act 获取)
- Claude Desktop 应用程序(如与 Claude 一起使用)
安装教程
- 克隆仓库:
bash git clone https://github.com/yourusername/nova-act-mcp.git cd nova-act-mcp
- 安装依赖:
bash pip install -r requirements.txt
调试方式
- 使用 MCP Inspector 工具测试:
bash npm install -g @modelcontextprotocol/inspector NOVA_ACT_API_KEY="your_api_key_here" npx @modelcontextprotocol/inspector uv --directory /path/to/nova-act-mcp run nova_mcp.py
- 测试浏览器操作:
json { "action": "start", "url": "https://www.google.com" }
然后:json { "action": "execute", "session_id": "your_session_id_from_previous_response", "instruction": "search for tea pots" }