-
人文数据分析补充材料数据集
2025年12月21日 30 26 18
数据集概述 本数据集是《人文数据分析:使用Python的案例研究》手稿的补充材料,按章节划分文件夹存储相关数据,包含1900年前出版的公有领域文本数据,各数据目录配有说明文档。 文件详解 文件名称: data.zip 文件格式: ZIP (.zip) 文件内容:...
-
印度议会颁布的中央法案标注数据集
2025年12月16日 30 132 54
数据集概述 该数据集包含1838年至2020年印度议会颁布的858部中央法案的结构化标注数据,通过PDF文本提取与正则处理生成JSON格式文件,涵盖法案标题、ID、颁布日期等元信息及章节、条款等结构化内容。 文件详解 文件名称: annotatedCentralActs.zip 文件格式: ZIP压缩包 包含内容:...
-
教育领域数学与科学题目章节分类数据集
2025年11月3日 30 52 23
教育领域数学与科学题目章节分类数据集_Education_Math_and_Science_Question_Chapter_Classification_Dataset 数据来源:互联网公开数据 标签:题目分类, 机器学习, 自然语言处理, 教育, 数学, 科学, 文本分析, 章节划分 数据概述:...



