-
Flemish_Archaeological_Texts_佛兰芒地区考古文献量化研究数据_2017
2026年1月7日 30 147 66
数据集概述 本数据集对1945-2017年比利时佛兰芒地区的荷兰语考古文献进行量化分析,涵盖专著、期刊文章、发掘报告等4500余份文献,共5100余万字。为避免版权问题,去除连词、冠词及4字母以下词汇,包含元数据、文本匹配结果、停用词表及处理后数据压缩包,支持研究复现。 文件详解 METADATA.xlsx 文件格式:XLSX...
-
ContentMine_Based_EuropePMC_Zika开放获取论文分析数据_20160919
2026年1月2日 30 200 101
数据集概述 本数据集包含通过ContentMine Cambridge流程从EuropePMC查询“zika”返回的524篇开放获取论文中提取的元数据与事实数据。数据使用的词典包含维基数据ID,可用于Zika相关医学文献的结构化分析,共包含2个JSON文件。 文件详解 文件名称:open-zika-wiki-...
-
美国鱼类和野生动物管理局宣传册类文档数据集
2025年12月22日 30 115 25
数据集概述 该数据集是美国鱼类和野生动物管理局(FWS)Servcat系统中宣传册类文档的归档数据,包含与鱼类和野生动物资源管理相关的报告、备忘录等材料,以压缩包形式存储。 文件详解 文件名称:Brochure.zip 文件格式:ZIP压缩包(.zip) 内容说明:压缩包内归档了FWS...
-
糖尿病生物标志物与分子机制多组学分析数据集
2025年12月19日 30 13 2
数据集概述 本数据集围绕糖尿病分子机制展开,通过文本挖掘、基因表达分析及机器学习方法,识别糖尿病相关高频基因与差异表达基因(DEGs),并筛选潜在诊断生物标志物。包含文献挖掘基因列表、基因表达数据及机器学习模型结果,为糖尿病分子机制研究提供多维度数据支持。 文件详解 该数据集包含以下文件: - 表格文件(.xlsx格式,共3个): -...
-
CLDF格式南钦语语言笔记数据集1988
2025年12月14日 30 119 64
数据集概述 该数据集为CLDF格式,源自1988年Helga So-Hartmann发表的《南钦语语言笔记》,收录了南钦语相关语言学研究内容,为南钦语语言特征分析提供结构化数据支持。 文件详解 文件名称:lexibank/sohartmannchin-v3.1.zip 文件格式:ZIP压缩包(.zip)...
-
BIOMAT_CellNER语料库训练与验证集
2025年12月4日 60 5 0
数据集概述 该数据集包含BIOMAT-CellNER语料库的训练集(七百五十篇文档)和验证集(一百篇文档),聚焦生物材料领域科学文献中细胞实体(细胞类型、细胞系)的命名实体识别标注,支持相关NER模型开发。 文件详解 数据集包含一个压缩文件,具体说明如下: - 文件名称: BIOMAT-CellNER_Train_Set.zip - 文件格式:...
-
德国维德里茨sch莫伦药房历史资料集1924_1948
2025年12月13日 30 172 54
数据集概述 本数据集收录了德国维德里茨sch莫伦药房的历史资料,核心为1924至1948年间的历史问卷、索引卡片及部分公开附件,通过Kalliope门户网站编目,反映该药房的历史沿革。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称:21298.pdf - 文件格式:PDF (.pdf) -...
-
手动标注的RNA相关科学文献实验数据集
2025年12月12日 30 104 72
数据集概述 本数据集包含从RNA相关科学文献中提取的一百个段落,所有内容均已根据LinkML模板完成实体与关系的人工标注,覆盖基因、蛋白质、RNA、化学物质、变异体(SNPs)、GO术语及疾病等关联信息,为RNA知识图谱研究提供基础数据。 文件详解 annotations.json:...
-
神经影像学文献挖掘论文匹配数据集
2025年12月4日 30 7 4
数据集概述 本数据集包含与《Mining the neuroimaging literature》论文匹配的标注数据,通过压缩文件存储,为神经影像学文献挖掘相关研究提供数据支持。 文件详解 该数据集由一个压缩文件组成,具体说明如下: - 文件名称: litmining/labelbuddy-annotations-v0.0.1.zip - 文件格式:...
-
PubMed医学文献数据集PubMedMedicalLiteratureDataset-pjmathematician
2025年5月28日 30 206 120
PubMed医学文献数据集PubMedMedicalLiteratureDataset-pjmathematician 数据来源:互联网公开数据 标签:医学研究,文献分析,数据集,生物医学,自然语言处理,机器学习,文献挖掘,学术资源...
-
自然语言处理核心技术与CORD-19疫情文献数据集NLPCoreandCORD-19OutputDataset-varunmittalnlpcore
2025年4月24日 30 128 49
自然语言处理核心技术与CORD-19疫情文献数据集NLPCoreandCORD-19OutputDataset-varunmittalnlpcore 数据来源:互联网公开数据 标签:自然语言处理,疫情研究,数据集,文本分析,机器学习,公共卫生,文献挖掘,人工智能 数据概述: 该数据集包含来自NLP...
-
机器学习论文语义分析数据集MachineLearningPapersSemanticScholarDataset-patrickgomes
2025年4月24日 30 156 68
机器学习论文语义分析数据集MachineLearningPapersSemanticScholarDataset-patrickgomes 数据来源:互联网公开数据 标签:机器学习,论文分析,数据集,语义分析,学术研究,自然语言处理,文献挖掘,知识图谱 数据概述: 该数据集包含来自语义学者(Semantic...



