数据集概述
该数据集包含美国矿山安全与健康管理局(MSHA)管辖下所有煤矿及金属/非金属矿的信息,涵盖矿山状态、所有者、运营公司、商品代码及物理属性等,以无摩擦数据包格式组织,是Catalyst Cooperative开发的PUDL软件的原始输入数据。
文件详解
该数据集包含40个文件,以.zip、.txt和.json格式为主,具体说明如下:
- 数据文件(.zip格式,共20个):
- mshamines-assessed_violations.zip:评估违规数据
- mshamines-contractor_prod_yearly.zip:承包商年度生产数据
- mshamines-civil_penalty_dockets_decisions.zip:民事处罚案卷裁决数据
- mshamines-accidents.zip:事故数据
- mshamines-mines.zip:矿山基础数据
- mshamines-area_samples.zip:区域样本数据
- mshamines-personal_health_samples.zip(推测,基于定义文件):个人健康样本数据
- 定义文件(.txt格式,共19个):
- mshamines-personal_health_samples_definitions.txt:个人健康样本数据字段定义
- mshamines-mines_prod_quarterly_definitions.txt:矿山季度生产数据字段定义
- mshamines-violations_definitions.txt:违规数据字段定义(示例字段:EVENT_NO,用于标识检查/调查的预分配编号)
- mshamines-civil_penalty_dockets_decisions_definitions.txt:民事处罚案卷裁决数据字段定义
- 数据包描述文件:
- datapackage.json:无摩擦数据包的元数据描述文件
数据来源
美国矿山安全与健康管理局(MSHA)OpenGovernmentData平台(https://arlweb.msha.gov/OpenGovernmentData/OGIMSHA.asp)
适用场景
- 矿山安全监管研究:分析矿山违规记录、事故数据与安全管理水平的关联
- 能源生产统计:整合矿山季度/年度生产数据,研究煤炭及金属矿产的产能分布
- 政策效果评估:通过民事处罚案卷数据,评估矿山安全政策的执行效果
- 公共卫生研究:利用个人健康样本数据,探索矿山作业环境对工人健康的影响
- 数据标准化实践:基于无摩擦数据包格式,开展开放数据标准化存储与共享的应用研究