印度议会颁布的中央法案标注数据集

数据集概述

该数据集包含1838年至2020年印度议会颁布的858部中央法案的结构化标注数据,通过PDF文本提取与正则处理生成JSON格式文件,涵盖法案标题、ID、颁布日期等元信息及章节、条款等结构化内容。

文件详解

  • 文件名称: annotatedCentralActs.zip
  • 文件格式: ZIP压缩包
  • 包含内容: 858个结构化JSON文件,每个文件对应一部中央法案,标注字段包括:
  • Act Title(法案简称)
  • Act ID(法案编号与年份)
  • Enactment Date(颁布日期)
  • Act Definition(法案全称/目的概述)
  • Chapters and Parts(章节/部分划分及ID、名称)
  • Sections(条款内容)
  • Subheadings(子标题,可选)
  • Schedule/Annexure/Appendix/Forms(附表/附件/附录/表单)
  • Footnotes(脚注,含页码与文本)

适用场景

  • 法律文本结构化研究:分析印度中央法案的文本组织模式与元信息提取方法
  • 法律人工智能训练:为法律文档解析、信息检索模型提供标注数据
  • 立法历史分析:研究1838-2020年印度中央法案的颁布趋势与主题演变
  • 法律数据库构建:支持印度法律文献的数字化与结构化存储系统开发
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 12.69 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。