Vibe Preprocessing and Analysis MCP Server for CSV files

Vibe Preprocessing and Analysis MCP Server for CSV files

site icon
2025.04.20 0
Python数据处理数据分析数据可视化开发效率
Vibe-Data-Analysis 是一个基于 MCP(Model Control Protocol)的服务器,专注于 CSV 文件的预处理和分析。它提供了一套强大的工具集,用于数据操作、可视化和分析,通过直观的界面简化数据处理流程。
View on GitHub

Overview

基本能力

产品定位

Vibe-Data-Analysis 是一个数据处理和分析工具,旨在帮助用户高效地预处理、分析和可视化 CSV 文件数据。

核心功能

  1. 数据加载与管理
  2. 从指定工作目录加载 CSV 文件
  3. 设置和管理工作目录
  4. 列出工作目录中的文件
  5. 将处理后的数据保存到新文件

  6. 数据预处理

  7. 处理混合数据类型的列
  8. 多种空值处理策略(删除、均值/中位数/众数填充、前后填充、常量填充)
  9. 删除和重命名列
  10. 运行自定义数据编辑代码

  11. 数据分析

  12. 生成数据描述统计
  13. 创建相关矩阵和可视化
  14. 运行自定义分析代码

  15. 数据可视化

  16. 支持多种图表类型(折线图、柱状图、散点图、直方图、箱线图、小提琴图、饼图、计数图、核密度估计图)
  17. 自定义图表生成
  18. 将可视化结果保存到工作目录

适用场景

  • 数据科学家进行数据探索和预处理
  • 研究人员分析实验数据
  • 开发人员快速验证数据模型
  • 教育工作者演示数据分析流程

使用教程

使用依赖

  • Python 3.x
  • 推荐使用 uv 包管理器

安装教程

  1. 添加 MCP 和依赖项:
uv add "mcp[cli]"
uv add pandas matplotlib seaborn numpy
  1. 在 Claude Desktop 中安装服务器:
mcp install server.py

替代安装方式(使用 pip)

pip install "mcp[cli]" pandas matplotlib seaborn numpy

调试方式

  1. 启动 MCP 服务器:
uv run mcp
  1. 使用 MCP Inspector 测试服务器:
mcp dev server.py

工具列表

数据管理工具

  • send_work_dir(): 获取当前工作目录
  • set_work_dir(new_work_dir): 设置新工作目录
  • list_work_dir_files(): 列出当前工作目录中的文件
  • load_csv(filename): 加载 CSV 文件
  • save_global_df(filename): 保存当前数据框到文件

数据预处理工具

  • handle_column_mixed_types(): 处理混合数据类型的列
  • handle_null_values(strategy, columns): 使用不同策略处理空值
  • drop_columns(columns): 删除指定列
  • rename_columns(column_mapping): 重命名列
  • run_custom_df_edit_code(code): 执行自定义数据编辑代码

数据分析工具

  • describe_df(): 生成数据描述统计
  • generate_correlation_matrix(): 创建相关矩阵和可视化

数据可视化工具

  • plot_graph(graph_type, x_column, y_column, output_filename): 创建各种图表
  • run_custom_graph_code(code): 执行自定义可视化代码

常见问题解答

  • 错误处理:服务器包含全面的错误处理机制,包括:
  • 工作目录缺失
  • 文件未找到
  • 数据加载和处理错误
  • 对空数据框的无效操作
  • 混合数据类型处理
  • 自定义代码执行错误
  • 无效列名
  • 无效图表类型
  • 空值处理错误

许可证

该项目遵循 None 开源许可条款。