-
数据19世纪法国商业名录数据集
2025年12月23日 30 184 152
数据集概述 该数据集包含1798至1861年间法国商业名录的页面与条目,分为标注数据集(8765条人工修正条目)和未标注数据集(1058196条原始条目),用于评估19世纪法语文档的OCR与NER性能。 文件详解 文件名称: README.md 文件格式: Markdown(.md) 内容: 数据集概述、引用方式、使用许可等说明文档 文件名称:...
-
SoftwareKG_Based_社会科学领域知识图谱完整数据
2025年12月20日 30 11 10
数据集概述 该数据集为SoftwareKG知识图谱,包含从PLoS平台51,165篇带“Social Science”标签的文章中提取的133,000余个软件提及信息,通过自动化流程提取并关联缩写与DBpedia,结合文章元数据构建,采用W3C标准RDF/S模型表示。 文件详解 文件名称: ESWC-SoftwareKG.zip 文件格式:...
-
BIOMAT_MONER语料库训练与验证集
2025年12月13日 30 132 12
数据集概述 该数据集为BIOMAT-MONER语料库的训练(750篇文档)与验证(100篇文档)集,用于生物材料领域科学文献中制造对象相关实体的命名实体识别(NER)模型开发,聚焦生物材料实验或应用中的制造对象及属性标注。 文件详解 文件名称: BIOMAT-MONER_Train_Set.zip 文件格式: .zip(压缩包) 内容说明:...



