Project Overview

Project Overview

site icon
2025.04.13 0
Python数据服务统计分析数据可视化API集成位置服务开发效率
StatCan Web Data Service MCP Server 是一个基于Model Context Protocol (MCP)的服务,旨在提供对加拿大统计局Web Data Service的访问。该服务使AI助手能够通过自然语言发现、探索、分析和引用加拿大统计数据。 ### 产品定位 该服务主要定位为数据服务和分析工具,专注于加拿大统计数据的访问、分析和可视化。 ### 核心功能 - 数据集发现:通过关键词、主题或地理位置搜索和浏览StatCan数据集 - 数据检索:提取时间序列数据并进行适当格式化 - 元数据探索:访问有关数据集结构和内容的详细信息 - 持久存储:使用SQLite后端存储数据集以供将来使用 - 高级分析:执行全面的统计分析、趋势检测、季节性分析和预测 - 可视化:集成Vega-Lite生成数据可视化 - 引用:为StatCan数据生成正确格式的引用 - API弹性:具有回退机制的强大错误处理功能 ### 适用场景 - 研究人员需要访问和分析加拿大统计数据 - 开发者需要将加拿大统计数据集成到他们的应用中 - 数据分析师需要进行统计分析和可视化 - 学术写作需要正确引用加拿大统计数据
View on GitHub

Overview

基本能力

主要特性

  • 数据集发现和浏览功能
  • 数据检索和格式化
  • 元数据探索
  • 持久化存储
  • 高级统计分析
  • 数据可视化
  • 引用生成
  • API弹性处理

使用场景

  1. 数据发现和研究:查找特定主题的加拿大统计数据
  2. 数据分析:对加拿大统计数据进行趋势分析和预测
  3. 学术写作:生成正确的数据引用
  4. 应用开发:将加拿大统计数据集成到应用中

工具列表

  1. 数据集发现工具:通过关键词、主题或地理位置搜索数据集
  2. 数据检索工具:提取和格式化时间序列数据
  3. 分析工具:执行趋势检测、季节性分析和预测
  4. 可视化工具:生成数据可视化图表
  5. 引用生成工具:为数据创建正确格式的引用

常见问题解答

  1. API访问问题:某些API端点可能存在问题,服务器实现了多级缓存和回退机制
  2. 格式敏感性:向量ID必须是数字,不带'v'前缀,有效载荷必须是数组格式
  3. 性能问题:大请求或在高峰时段可能会超时
  4. 速率限制:高容量查询可能会被StatCan WDS API限制

使用教程

使用依赖

pip install sqlitedict aiohttp mcp pydantic python-dotenv pandas numpy

安装教程

# Clone the repository
git clone https://github.com/yourusername/mcp-statcan.git
cd mcp-statcan

# Create a virtual environment
python -m venv venv
source venv/bin/activate  # On Windows: venv\Scripts\activate

# Install dependencies
pip install -e .

# Start the MCP server
python -m src

调试方式

python -m tests.api.api_connection_steps

此命令运行逐步测试,包括: - API连接性 - 元数据检索 - 向量数据访问 - 格式要求

许可证

该项目遵循 MIT 开源许可条款,请参阅 MIT 了解完整条款。