
Project Overview

2025.04.13
0
Python数据服务统计分析数据可视化API集成位置服务开发效率
StatCan Web Data Service MCP Server 是一个基于Model Context Protocol (MCP)的服务,旨在提供对加拿大统计局Web Data Service的访问。该服务使AI助手能够通过自然语言发现、探索、分析和引用加拿大统计数据。
### 产品定位
该服务主要定位为数据服务和分析工具,专注于加拿大统计数据的访问、分析和可视化。
### 核心功能
- 数据集发现:通过关键词、主题或地理位置搜索和浏览StatCan数据集
- 数据检索:提取时间序列数据并进行适当格式化
- 元数据探索:访问有关数据集结构和内容的详细信息
- 持久存储:使用SQLite后端存储数据集以供将来使用
- 高级分析:执行全面的统计分析、趋势检测、季节性分析和预测
- 可视化:集成Vega-Lite生成数据可视化
- 引用:为StatCan数据生成正确格式的引用
- API弹性:具有回退机制的强大错误处理功能
### 适用场景
- 研究人员需要访问和分析加拿大统计数据
- 开发者需要将加拿大统计数据集成到他们的应用中
- 数据分析师需要进行统计分析和可视化
- 学术写作需要正确引用加拿大统计数据
View on GitHub
Overview
基本能力
主要特性
- 数据集发现和浏览功能
- 数据检索和格式化
- 元数据探索
- 持久化存储
- 高级统计分析
- 数据可视化
- 引用生成
- API弹性处理
使用场景
- 数据发现和研究:查找特定主题的加拿大统计数据
- 数据分析:对加拿大统计数据进行趋势分析和预测
- 学术写作:生成正确的数据引用
- 应用开发:将加拿大统计数据集成到应用中
工具列表
- 数据集发现工具:通过关键词、主题或地理位置搜索数据集
- 数据检索工具:提取和格式化时间序列数据
- 分析工具:执行趋势检测、季节性分析和预测
- 可视化工具:生成数据可视化图表
- 引用生成工具:为数据创建正确格式的引用
常见问题解答
- API访问问题:某些API端点可能存在问题,服务器实现了多级缓存和回退机制
- 格式敏感性:向量ID必须是数字,不带'v'前缀,有效载荷必须是数组格式
- 性能问题:大请求或在高峰时段可能会超时
- 速率限制:高容量查询可能会被StatCan WDS API限制
使用教程
使用依赖
pip install sqlitedict aiohttp mcp pydantic python-dotenv pandas numpy
安装教程
# Clone the repository
git clone https://github.com/yourusername/mcp-statcan.git
cd mcp-statcan
# Create a virtual environment
python -m venv venv
source venv/bin/activate # On Windows: venv\Scripts\activate
# Install dependencies
pip install -e .
# Start the MCP server
python -m src
调试方式
python -m tests.api.api_connection_steps
此命令运行逐步测试,包括: - API连接性 - 元数据检索 - 向量数据访问 - 格式要求