
Vibe Preprocessing and Analysis MCP Server for CSV files

2025.04.20
0
Python数据处理数据分析数据可视化开发效率
Vibe-Data-Analysis 是一个基于 MCP(Model Control Protocol)的服务器,专注于 CSV 文件的预处理和分析。它提供了一套强大的工具集,用于数据操作、可视化和分析,通过直观的界面简化数据处理流程。
View on GitHub
Overview
基本能力
产品定位
Vibe-Data-Analysis 是一个数据处理和分析工具,旨在帮助用户高效地预处理、分析和可视化 CSV 文件数据。
核心功能
- 数据加载与管理
- 从指定工作目录加载 CSV 文件
- 设置和管理工作目录
- 列出工作目录中的文件
-
将处理后的数据保存到新文件
-
数据预处理
- 处理混合数据类型的列
- 多种空值处理策略(删除、均值/中位数/众数填充、前后填充、常量填充)
- 删除和重命名列
-
运行自定义数据编辑代码
-
数据分析
- 生成数据描述统计
- 创建相关矩阵和可视化
-
运行自定义分析代码
-
数据可视化
- 支持多种图表类型(折线图、柱状图、散点图、直方图、箱线图、小提琴图、饼图、计数图、核密度估计图)
- 自定义图表生成
- 将可视化结果保存到工作目录
适用场景
- 数据科学家进行数据探索和预处理
- 研究人员分析实验数据
- 开发人员快速验证数据模型
- 教育工作者演示数据分析流程
使用教程
使用依赖
- Python 3.x
- 推荐使用 uv 包管理器
安装教程
- 添加 MCP 和依赖项:
uv add "mcp[cli]"
uv add pandas matplotlib seaborn numpy
- 在 Claude Desktop 中安装服务器:
mcp install server.py
替代安装方式(使用 pip)
pip install "mcp[cli]" pandas matplotlib seaborn numpy
调试方式
- 启动 MCP 服务器:
uv run mcp
- 使用 MCP Inspector 测试服务器:
mcp dev server.py
工具列表
数据管理工具
send_work_dir()
: 获取当前工作目录set_work_dir(new_work_dir)
: 设置新工作目录list_work_dir_files()
: 列出当前工作目录中的文件load_csv(filename)
: 加载 CSV 文件save_global_df(filename)
: 保存当前数据框到文件
数据预处理工具
handle_column_mixed_types()
: 处理混合数据类型的列handle_null_values(strategy, columns)
: 使用不同策略处理空值drop_columns(columns)
: 删除指定列rename_columns(column_mapping)
: 重命名列run_custom_df_edit_code(code)
: 执行自定义数据编辑代码
数据分析工具
describe_df()
: 生成数据描述统计generate_correlation_matrix()
: 创建相关矩阵和可视化
数据可视化工具
plot_graph(graph_type, x_column, y_column, output_filename)
: 创建各种图表run_custom_graph_code(code)
: 执行自定义可视化代码
常见问题解答
- 错误处理:服务器包含全面的错误处理机制,包括:
- 工作目录缺失
- 文件未找到
- 数据加载和处理错误
- 对空数据框的无效操作
- 混合数据类型处理
- 自定义代码执行错误
- 无效列名
- 无效图表类型
- 空值处理错误