MCP Server & Client implementation for using Azure OpenAI

MCP Server & Client implementation for using Azure OpenAI

2025.04.07 15

Python浏览器自动化开发效率浏览器自动化开发效率

mcp-aoai-web-browsing 是一个基于 Model Context Protocol (MCP) 和 Azure OpenAI 的服务器/客户端实现，主要用于现代 Web 应用程序的自动化测试和交互。它结合了 FastMCP 和 Playwright 框架，能够将 MCP 服务器响应转换为 OpenAI 函数调用格式，从而实现与 OpenAI 兼容的 LLMs 的通信。

View on GitHub

Overview

基本能力

产品定位

mcp-aoai-web-browsing 是一个用于现代 Web 应用程序自动化测试和交互的工具，结合了 Azure OpenAI 的能力，提供高效的浏览器自动化解决方案。

核心功能

MCP 服务器实现：基于 FastMCP 构建，支持与 Azure OpenAI 的集成。
浏览器自动化：使用 Playwright 框架进行端到端测试和 Web 应用程序交互。
MCP-LLM Bridge：将 MCP 服务器响应转换为 OpenAI 函数调用格式，实现与 LLMs 的通信。
工具描述：支持工具描述机制，类似于 LLMs 中的函数调用。

适用场景

Web 应用程序自动化测试：通过 Playwright 进行端到端测试。
浏览器自动化：自动化导航、点击、表单填写等操作。
与 LLMs 集成：通过 MCP-LLM Bridge 实现与 OpenAI 兼容的 LLMs 的交互。

工具列表

playwright_navigate：导航到指定 URL，支持超时和等待条件设置。

常见问题解答

依赖管理：推荐使用 uv 进行 Python 库管理，其他工具如 pip 和 poetry 尚未完全支持。
调试：可以使用 Visual Code 的 Python 调试器进行调试。

使用教程

使用依赖

安装 uv：

bash pip install uv uv sync

安装教程

重命名 .env.template 为 .env，并填写 Azure OpenAI 的相关配置：

bash AZURE_OPEN_AI_ENDPOINT= AZURE_OPEN_AI_API_KEY= AZURE_OPEN_AI_DEPLOYMENT_MODEL= AZURE_OPEN_AI_API_VERSION=
执行 python chatgui.py 启动客户端。

调试方式

使用 Visual Code 的 Python 调试器：
配置 .vscode/launch.json 文件以启动调试器。
终止 Python 进程：

cmd taskkill /IM python.exe /F

许可证

该项目遵循 MIT 开源许可条款，请参阅 MIT 了解完整条款。