数据集概述
该数据集是对巴西国家司法委员会(CNJ)提供的TPU编码(涉及主题、动议和类别)进行处理与整合的结果。通过脚本处理原始Excel文件,完成数据清洗、编码转换、重复项移除等步骤,最终生成按类别划分的CSV文件及统一的Excel表格,为司法数据标准化提供支持。
文件详解
- 原始数据目录(LAKE/):
- Assunto/*.xlsx:主题相关的原始Excel文件
- Movimentos/*.xlsx:动议相关的原始Excel文件
- classe/*.xlsx:类别相关的原始Excel文件
- 中间输出文件(OUTPUT/):
- Assunto/*.csv:处理后的主题中间CSV文件
- Movimentos/*.csv:处理后的动议中间CSV文件
- classe/*.csv:处理后的类别中间CSV文件
- 最终数据文件(BANCO/):
- [Assunto|Movimentos|classe]_tpu_nome_marcadores.csv:按类别划分的最终CSV文件,包含id、id_pai、nome、来源标记等字段
- 统一表格文件:
- planilha_unificada.xlsx:整合所有TPU编码的统一Excel表格
数据来源
巴西国家司法委员会(CNJ)
适用场景
- 司法数据标准化研究:分析CNJ TPU编码体系的结构与应用
- 司法流程优化:研究主题、动议、类别编码的层级关系与使用逻辑
- 法律信息系统开发:为司法相关系统提供标准化编码数据支持
- 司法数据分析:基于标准化编码开展司法案例统计与趋势分析