-
PMC_OA_Based_神经疾病生物医学文献表格识别基准数据集
2026年1月28日 30 1 0
数据集概述 本数据集包含来自1164篇PMC开放获取(OA)神经疾病相关文献的1650个表格,采用国际文档分析与识别会议(ICDAR)格式结构化。同时提供分类CSV文件,将表格分为简单、复杂、极复杂三类。数据集共863个文件,以XML格式为主,支持生物医学文献表格识别任务的基准测试。 文件详解 XML文件(862个)...
-
PMC_Based_SoftwareKG_PMC_软件知识图谱完整数据
2025年12月6日 30 35 13
数据集概述 本数据集是从PMC开放获取数据集中提取的软件提及知识图谱(SoftwareKG-PMC),以CSV格式压缩包存储。因PDF格式文章未被纳入,涉及的文章总数为三百零三万六千九百一十三篇,为软件相关学术提及的关联分析提供结构化数据支持。 文件详解 文件名称: csv_files.zip 文件格式: ZIP压缩包 内容说明:...



