-
法国建筑技术规范木工条款命名实体识别与关系抽取标注数据集
2025年12月15日 30 128 75
数据集概述 本数据集包含从法国建筑技术规范(CCTP)中提取的二百三十三条原始木工条款要求,来源于七十二份法国公共建筑项目的CCTP文档,涵盖一万九千七百二十五句、六十五万一千九百四十八个词。数据集通过Doccano工具完成命名实体识别(NER)和关系抽取(RE)标注,适用于建筑领域需求工程的自然语言处理研究。 文件详解...
-
计算机科学出版物引用网络数据集
2025年12月14日 30 205 134
数据集概述 该数据集包含三百七十二万零五百七十五篇计算机科学领域论文及其内部引用关系,元数据整合自OpenAlex、DBLP、CORE和SCImago等平台,以JSON Lines格式存储,为研究计算机科学领域的文献引用网络提供全面数据支持。 文件详解 该数据集以ZIP压缩包形式分发,解压后包含以下文件: - 文档文件: -...
-
Reddit叙事中的道德判断数据集
2025年12月13日 30 154 88
数据集概述 该数据集聚焦Reddit平台叙事内容中的道德判断研究,通过社交常识与语言信号识别道德触发点。包含标注道德触发点的帖子实例数据,以及研究使用的事件聚类、语言特征参数等补充文档,为分析在线社区道德判断机制提供支持。 文件详解 post_instances.jsonl:JSON...
-
政策文件引用学术出版物开放数据集_POLIDOC_SCHOLAR
2025年12月11日 30 143 21
数据集概述 该数据集收录了精选政策文件中引用的学术出版物,通过"集合"和"集合参考文献"两类文件组织数据,包含IPCC第六次评估周期、IPBES评估报告等2个集合的文献引用信息,支持与外部数据库的关联分析。 文件详解 集合元数据文件: collections.jsonl:JSON...



