PUDL_Based_美国SEC_10_K表原始数据_数据包

数据集概述

本数据集为Catalyst Cooperative开发的公共事业数据开放(PUDL)软件的原始输入数据,包含美国证券交易委员会(SEC)10-K表的部分元数据及非结构化附件Exhibit 21提取数据,用于关联EIA公用事业与SEC报告公司,分析企业及其子公司的所有权关系及经济政治影响。

文件详解

  • 数据文件(.parquet格式,共4个)
  • raw_sec10k__quarterly_company_information.parquet:季度公司信息原始数据
  • raw_sec10k__parents_and_subsidiaries.parquet:母公司与子公司关系原始数据
  • raw_sec10k__quarterly_filings.parquet:季度 filings 原始数据
  • raw_sec10k__exhibit_21_company_ownership.parquet:Exhibit 21 公司所有权关系原始数据
  • 元数据文件
  • datapackage.json:JSON格式,包含数据集名称、标题、描述、关键词、贡献者、来源、许可证、资源等元数据字段

数据来源

美国证券交易委员会(SEC)EDGAR数据库,经Catalyst Cooperative的机器学习管道处理

适用场景

  • 企业所有权关系分析:通过Exhibit 21数据研究母公司与子公司的关联结构
  • 公用事业与证券市场关联研究:建立EIA公用事业与SEC报告公司的链接,分析经济与政治影响
  • 公共事业数据整合:作为PUDL软件的原始输入,支持公用事业数据的开放与分析
  • 企业财务信息挖掘:利用10-K表元数据探索公司财务表现的综合特征
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 170.71 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。