-
SoMeSci_科学文献中的软件提及数据集
数据集概述 该数据集是通过人工标注构建的科学文献中软件提及的黄金标准知识图谱,包含原始黄金标准数据及所有软件相关引用的标注内容,为科学文献中软件提及的研究提供标准化数据支持。 文件详解 Formal_Citation.zip:压缩文件,包含所有软件相关引用的标注数据 SoMeSci.zip:压缩文件,包含原始SoMeSci黄金标准数据 数据来源...
-
BIOMAT_CellNER语料库训练与验证集
数据集概述 该数据集包含BIOMAT-CellNER语料库的训练集(七百五十篇文档)和验证集(一百篇文档),聚焦生物材料领域科学文献中细胞实体(细胞类型、细胞系)的命名实体识别标注,支持相关NER模型开发。 文件详解 数据集包含一个压缩文件,具体说明如下: - 文件名称: BIOMAT-CellNER_Train_Set.zip - 文件格式:...
-
印刷版欧几里得著作目录1482_1703
数据集概述 本数据集是一份目录,旨在收录1482至1703年间以任何语言印刷、归属于欧几里得的所有单部或多部著作版本。它改进了Riccardi、Duarte等早期学者在数字目录普及前编纂的欧几里得书目,为研究早期印刷版欧几里得著作提供了系统的文献参考。 文件详解 文件名称: Euclid_v1.pdf 文件格式: PDF (.pdf) 文件内容:...
-
BIOMAT_MONER语料库训练与验证集
数据集概述 该数据集为BIOMAT-MONER语料库的训练(750篇文档)与验证(100篇文档)集,用于生物材料领域科学文献中制造对象相关实体的命名实体识别(NER)模型开发,聚焦生物材料实验或应用中的制造对象及属性标注。 文件详解 文件名称: BIOMAT-MONER_Train_Set.zip 文件格式: .zip(压缩包) 内容说明:...
-
手动标注的RNA相关科学文献实验数据集
数据集概述 本数据集包含从RNA相关科学文献中提取的一百个段落,所有内容均已根据LinkML模板完成实体与关系的人工标注,覆盖基因、蛋白质、RNA、化学物质、变异体(SNPs)、GO术语及疾病等关联信息,为RNA知识图谱研究提供基础数据。 文件详解 annotations.json:...
-
CMIP6高分辨率模式比较项目CMCC_CM2_HR4数据集
数据集概述 该数据集为第六次耦合模式比较计划(CMIP6)高分辨率模式比较项目(HighResMIP)下的CMCC-CM2-HR4模式数据,包含该模式相关的公开文档,为理解高分辨率气候模式模拟结果提供支持。 文件详解 文件名称: CMCC-CM2-HR4.pdf 文件格式: PDF (.pdf) 文件内容:...
-
维基数量与维基测量数据集
数据集概述 该数据集包含Wiki-Quantities和Wiki-Measurements两个子数据集,分别用于支持数量识别与测量上下文提取任务。数据从维基百科文章和维基数据事实启发式生成,部分样本添加S2ORC数据集引用以增强模型鲁棒性,为测量提取系统的开发与评估提供支持。 文件详解 核心压缩文件: Wiki-Quantities.zip:...
-
黑珊瑚与非造礁石珊瑚研究文献数据集
数据集概述 该数据集包含三篇关于黑珊瑚(Antipatharia)和非造礁石珊瑚(Alcyonacea)的研究文献,涉及冷-water珊瑚丘生态作用、墨西哥湾西北部黑珊瑚食性稳定同位素分析及红海北部黑珊瑚生态研究等内容。 文件详解 文件名称: De_Clippele.zip 文件格式: ZIP (.zip) 文件内容:...
-
MESINESP2西班牙语生物医学语义索引标注语料库
数据集概述 该数据集为MESINESP2任务生成的人工标注语料库,包含科学文献、临床试验、专利摘要三类西班牙语生物医学文档,由领域专家使用DeCS受控词汇标注,旨在推动非英语生物医学内容语义索引工具的开发。 文件详解 子任务语料压缩包:...
-
人工智能在科学数据库文献检索中的应用比较数据集
数据集概述 该数据集包含在ChatGPT、Copilot和Gemini三种人工智能工具中执行文献检索命令的所有结果,内容围绕科学数据库文献检索中不同AI工具的搜索表达式比较展开,所有结果以PDF格式呈现,支持相关研究的验证与分析。 文件详解 该数据集包含十五个PDF格式文件,文件命名以不同AI工具和实验编号标识,具体如下:...
-
CMIP6高分辨率模式比较计划欧洲中期天气预报中心数据集
数据集概述 本数据集属于第六次耦合模式比较计划(CMIP6)的高分辨率模式比较项目(HighResMIP),包含欧洲中期天气预报中心(ECMWF)的ECMWF-IFS-HR模式相关数据,以PDF文档形式呈现。 文件详解 文件名称: ECMWF-IFS-HR.pdf 文件格式: PDF (.pdf) 内容说明:...
-
无来源_TARKIBNING_DOIMIYLIK_QONUNI_VA_MATERIYANING_OZGARMAS_MOHIYATI_化学理论材料特性分析完整数据
数据集概述 本数据集包含一份关于“组成恒定性定律与物质不变性质”的PDF文档,核心围绕该主题的相关内容展开,为相关领域研究提供文献资料支持。 文件详解 文件名称: Axmedova Maxpirat Lapasovna..pdf 文件格式: PDF (.pdf) 内容说明: 文档主题为“TARKIBNING DOIMIYLIK QONUNI VA...
-
独立作者报告第61期
数据集概述 本数据集为独立作者报告的第61期,包含一篇关于从安培到爱因斯坦的电动力学历史的著作俄文译本,原作者为奥利弗·达里戈拉,此前未以俄语出版,为俄语读者提供了该领域的专业内容。 文件详解 文件名称: DNA.61.000.pdf 文件格式: PDF (.pdf) 文件内容:...
-
GULUSTAN黑海学术研究科学期刊文献集
数据集概述 本数据集包含《GULUSTAN BLACK SEA SCIENTIFIC JOURNAL OF ACADEMIC RESEARCH》期刊的学术文献,覆盖农业、环境科学、社会科学、医学、技术科学等多个学科领域,文献以单篇PDF格式呈现,为跨学科研究提供参考资料。 文件详解 文件名称:13.06.2014.pdf 文件格式:PDF(.pdf)...
-
撒哈拉以南非洲河流与溪流氮含量数据集2024
数据集概述 该数据集收录了截至2024年7月科学文献中报告的撒哈拉以南非洲254个河流与溪流站点的氮化合物浓度及输出量数据,含干、湿季分类数据,同时包含pH值、电导率等辅助参数,为区域氮循环研究提供支持。 文件详解 Dataset.xlsx:Excel格式文件,包含三个标签页 第一标签页:站点氮化合物浓度、输出量及辅助参数数据...
-
GULXAYRI植物化学成分与医学应用文献分析
数据集概述 本数据集为一份关于GULXAYRI植物的文献分析资料,内容涵盖植物的基本描述、化学成分及其在医学领域的应用,基于对相关科学文献的系统分析整理而成。 文件详解 文件名称:Mirzayeva Zubayda Odiljon qizi.pdf 文件格式:PDF(.pdf)...
-
火星沙漠研究站生物多样性补充材料30_2016
数据集概述 该数据集为2016年发表的火星沙漠研究站生物多样性研究的补充材料30,包含编号为CAN 607472的道格拉斯彩花(Chaenactis douglasii var. douglasii)样本的相关图像数据,支持对该区域生物多样性的研究。 文件详解 文件名称: oo_60808.jpg 文件格式: JPG(.jpg) 内容说明:...
-
火星沙漠研究站植物补充材料46_2016
数据集概述 该数据集为2016年发布的火星沙漠研究站植物相关研究的补充材料46,包含一株名为Ephedra viridis(编号Sokoloff 365,CAN 607523)的植物样本图片,用于辅助展示研究中的植物样本信息。 文件详解 文件名称:oo_60824.jpg 文件格式:JPG(.jpg) 文件内容:火星沙漠研究站植物样本Ephedra...
-
俄语构词法问题的多方面复合问题研究与科学发展方向数据集
数据集概述 本数据集围绕俄语构词法问题展开,聚焦其多方面复合问题及科学发展方向。包含一份PDF格式文档,为俄语构词法领域的研究提供理论探讨与发展方向的参考资料。 文件详解 文件名称: Рамазанова Шоира Рихсибаевна.pdf 文件格式: PDF (.pdf) 文件内容:...
-
冠状病毒科学文献动态主题模型标签数据集
数据集概述 本数据集包含基于论文提出的无监督标签技术生成的动态主题模型(DTM)标签,涵盖100个和200个主题模型,分别使用全语料库和仅COVID-19时期数据训练,为冠状病毒科学文献的主题分析提供标签支持。 文件详解 文件名称:REPORT_ALL_200.html,文件格式:HTML,内容为使用全语料库训练的200个主题模型的标签报告...



