nova-act-mcp

nova-act-mcp

site icon
2025.04.18 5
Python浏览器自动化AI助手集成浏览器自动化
nova-act-mcp 是一个基于 Amazon Nova Act SDK 的 MCP 服务器,旨在通过自然语言指令控制网页浏览器,实现交互式浏览器自动化。它作为 Nova Act 浏览器自动化 SDK 和模型上下文协议(MCP)之间的桥梁,允许 AI 助手(如 Claude)通过自然语言指令控制浏览器执行任务,并提供对代理推理过程的透明视图。
View on GitHub

Overview

基本能力

产品定位

nova-act-mcp 是一个浏览器自动化工具,通过 MCP 协议与 AI 助手集成,实现自然语言驱动的网页交互。

核心功能

  1. 浏览器控制:直接通过 AI 助手控制网页浏览器
  2. 任务执行:执行交互式浏览器自动化任务
  3. 会话保持:在交互之间维护浏览器会话
  4. 透明推理:查看代理的逐步推理过程
  5. 会话管理:支持启动、执行指令和结束会话
  6. 持久会话:维护浏览器配置文件,保留登录状态和本地数据

适用场景

  1. 通过自然语言指令进行网页搜索
  2. 自动化填写表单和提交数据
  3. 网页内容抓取和分析
  4. 多步骤网页操作流程自动化
  5. 与需要登录的网站交互

工具列表

  1. nova-browser:主工具,提供浏览器控制能力
  2. 启动浏览器会话
  3. 执行自然语言指令
  4. 结束会话

常见问题解答

  1. Nova Act API 密钥问题
  2. 验证密钥有效性
  3. 检查配置是否正确
  4. 尝试设置为环境变量
  5. 浏览器自动化问题
  6. 检查代理思考字段
  7. 使指令更具体
  8. 对表单和登录明确字段名称
  9. 调试模式:设置 NOVA_MCP_DEBUG=1 获取详细诊断信息

使用教程

使用依赖

  1. Python 3.10 或更高版本
  2. Amazon Nova Act API 密钥(从 https://nova.amazon.com/act 获取)
  3. Claude Desktop 应用程序(如与 Claude 一起使用)

安装教程

  1. 克隆仓库: bash git clone https://github.com/yourusername/nova-act-mcp.git cd nova-act-mcp
  2. 安装依赖: bash pip install -r requirements.txt

调试方式

  1. 使用 MCP Inspector 工具测试: bash npm install -g @modelcontextprotocol/inspector NOVA_ACT_API_KEY="your_api_key_here" npx @modelcontextprotocol/inspector uv --directory /path/to/nova-act-mcp run nova_mcp.py
  2. 测试浏览器操作: json { "action": "start", "url": "https://www.google.com" } 然后: json { "action": "execute", "session_id": "your_session_id_from_previous_response", "instruction": "search for tea pots" }

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。