
Databricks MCP Server

2025.03.10
8
PythonSQL查询服务Databricks集成数据库
Databricks MCP Server 是一个基于 Model Context Protocol (MCP) 的服务,用于通过 Databricks 的 Statement Execution API 执行 SQL 查询。它能够通过 Databricks API 执行 SQL 请求来检索数据,特别适用于在代理模式下迭代执行多个请求以完成复杂任务。结合 Unity Catalog Metadata 使用时效果更佳。
View on GitHub
Overview
基本能力
产品定位
Databricks MCP Server 是一个专为 Databricks 设计的 SQL 查询执行服务,通过 MCP 协议提供数据访问能力。
核心功能
- 在 Databricks 上执行 SQL 查询
- 列出目录中可用的模式
- 列出模式中的表
- 描述表结构
适用场景
- 需要从 Databricks 数据库查询数据的场景
- 需要自动化执行复杂 SQL 任务的场景
- 需要集成 Databricks 数据访问能力的代理应用
工具列表
execute_sql_query
: 执行 SQL 查询并返回结果list_schemas
: 列出特定目录中的所有可用模式list_tables
: 列出特定模式中的所有表describe_table
: 描述表的结构
常见问题解答
- 权限要求:确保用户令牌具有访问 SQL 仓库和数据目录的适当权限
- 长查询处理:默认超时为 10 分钟,可在
dbapi.py
中调整 - 环境配置:需要通过环境变量或 .env 文件设置 Databricks 凭证
使用教程
使用依赖
- Python 3.10+
- 可选:uv 安装工具
安装步骤
- 安装依赖:
pip install -r requirements.txt
或使用 uv:
uv pip install -r requirements.txt
- 设置环境变量:
- 方法1:创建 .env 文件
DATABRICKS_HOST=your-databricks-instance.cloud.databricks.com
DATABRICKS_TOKEN=your-databricks-access-token
DATABRICKS_SQL_WAREHOUSE_ID=your-sql-warehouse-id
- 方法2:直接设置环境变量
export DATABRICKS_HOST="your-databricks-instance.cloud.databricks.com"
export DATABRICKS_TOKEN="your-databricks-access-token"
export DATABRICKS_SQL_WAREHOUSE_ID="your-sql-warehouse-id"
调试方式
- 独立运行模式:
python main.py
- 与 Cursor 集成:
- 创建
~/.cursor/mcp.json
配置文件 - 添加服务器配置
- 重启 Cursor 应用更改
许可证
None