MCP Server & Client implementation for using Azure OpenAI

MCP Server & Client implementation for using Azure OpenAI

site icon
2025.04.07 15
Python浏览器自动化开发效率浏览器自动化开发效率
mcp-aoai-web-browsing 是一个基于 Model Context Protocol (MCP) 和 Azure OpenAI 的服务器/客户端实现,主要用于现代 Web 应用程序的自动化测试和交互。它结合了 FastMCP 和 Playwright 框架,能够将 MCP 服务器响应转换为 OpenAI 函数调用格式,从而实现与 OpenAI 兼容的 LLMs 的通信。
View on GitHub

Overview

基本能力

产品定位

mcp-aoai-web-browsing 是一个用于现代 Web 应用程序自动化测试和交互的工具,结合了 Azure OpenAI 的能力,提供高效的浏览器自动化解决方案。

核心功能

  1. MCP 服务器实现:基于 FastMCP 构建,支持与 Azure OpenAI 的集成。
  2. 浏览器自动化:使用 Playwright 框架进行端到端测试和 Web 应用程序交互。
  3. MCP-LLM Bridge:将 MCP 服务器响应转换为 OpenAI 函数调用格式,实现与 LLMs 的通信。
  4. 工具描述:支持工具描述机制,类似于 LLMs 中的函数调用。

适用场景

  1. Web 应用程序自动化测试:通过 Playwright 进行端到端测试。
  2. 浏览器自动化:自动化导航、点击、表单填写等操作。
  3. 与 LLMs 集成:通过 MCP-LLM Bridge 实现与 OpenAI 兼容的 LLMs 的交互。

工具列表

  1. playwright_navigate:导航到指定 URL,支持超时和等待条件设置。

常见问题解答

  1. 依赖管理:推荐使用 uv 进行 Python 库管理,其他工具如 pippoetry 尚未完全支持。
  2. 调试:可以使用 Visual Code 的 Python 调试器进行调试。

使用教程

使用依赖

  1. 安装 uv

    bash pip install uv uv sync

安装教程

  1. 重命名 .env.template.env,并填写 Azure OpenAI 的相关配置:

    bash AZURE_OPEN_AI_ENDPOINT= AZURE_OPEN_AI_API_KEY= AZURE_OPEN_AI_DEPLOYMENT_MODEL= AZURE_OPEN_AI_API_VERSION=

  2. 执行 python chatgui.py 启动客户端。

调试方式

  1. 使用 Visual Code 的 Python 调试器:
  2. 配置 .vscode/launch.json 文件以启动调试器。
  3. 终止 Python 进程:

    cmd taskkill /IM python.exe /F

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。