-
Neo_Assyrian_Oracc_Based新亚述语料库族名分布模式研究数据
数据集概述 本数据集是论文“Broad-scale patterns in the distribution of ethnic names in the Neo-Assyrian Oracc corpus”的关联表格与列表,包含8个文件,涉及族名分布的语义分析、拼写标准化、文本类型分类等内容,用于支撑新亚述Oracc语料库中族名分布模式的研究。...
-
基于微生物组数据库的MAG基因组元数据与表型预测及KEGG模块数据_20250827
数据集概述 本数据集来自Microbiome Datahub数据库,包含214,427个宏基因组组装基因组(MAGs)的相关数据,涵盖MAGs的元数据、Bac2Feature表型预测结果及基于MBGD同源基因组成推断的KEGG模块组成矩阵,共4个文件,为微生物组基因组研究提供结构化数据支持。 文件详解 ModuleListName.tsv...
-
Supplementary_Materials_Based_欧洲议会英德翻译句法研究补充数据
数据集概述 本数据集为Languages期刊投稿论文的补充材料,包含欧洲议会英文演讲及其德语笔译、口译文本的句法研究相关文件,涵盖转录文本、词性频率数据、口译员识别数据、统计分析脚本及可视化图表,以压缩包形式提供。 文件详解 压缩包文件 文件名称:SupMat.zip 文件格式:ZIP 包含内容:...
-
Beacon_Training_Material_Beacon_V2教程训练数据
数据集概述 本数据集为Galaxy Training Material中“Working with Beacon V2”教程的训练数据,包含来自1000 Genomes Project和GDC数据库的5个文件,覆盖JSON、XLSX、VCF、TSV格式,用于指导用户学习Beacon V2的构建、数据转换、导入及变体查询技能,支撑教程中的实操练习。...
-
TEAR_MS_MS_Search_Results_人泪液蛋白质组成正常变异数据
数据集概述 本数据集是研究健康志愿者泪液蛋白质组成正常变异的MS/MS搜索结果,包含34个文件。研究通过定量蛋白质组学方法分析泪液样本的蛋白质谱,评估了标准化和异常值排除方法以减少变异,发现泪液蛋白质组和免疫球蛋白组成具有个人特征,并识别出与蛋白质来源相关的相关蛋白簇。 文件详解 XML文件(24个) 文件名称:如interact-TEAR-POOL-...
-
PXD024291_Reanalysis_微生物群落蛋白质稳定同位素探测重分析数据
数据集概述 本数据集是对PXD024291的重分析结果,来源于论文“De novo peptide databases enable protein-based stable isotope probing of microbial communities with up to species-level...
-
Distant_Listening_Corpus_Based_带注释乐谱语料库数据
数据集概述 本数据集是DCML语料库计划下创建的带注释乐谱语料库,采用DCML和声注释标准,包含多类公共乐谱子语料库,为带注释音乐的实证研究提供模块化基础设施,覆盖巴赫、贝多芬等多位作曲家的作品,支持音乐分析相关研究。 文件详解 压缩包文件...
-
Growth_temperatures_Based_21498种微生物生长温度数据集
数据集概述 本数据集包含21498种微生物(古菌、细菌和真核生物)的物种名称及生长温度信息,同时提供微生物所属域、分类标识符、分类谱系文本及解析后的分类层级(超界、门、纲、目、科、属)等元数据,为微生物学研究提供结构化的生长温度参考数据。 文件详解 温度数据文件 文件名称:temperature_data.tsv 文件格式:TSV...
-
cartloader_Based_Pixel_seq空间转录组学数据转换与可视化结果数据
数据集概述 本数据集是cartloader公开教程的组成部分,基于Pixel-seq小鼠数据集,展示如何使用cartloader工具包分析空间转录组学数据,并将其转换为网络优化的空间索引PMTiles文件,支持下游分析、交互式网络可视化及跨平台数据共享。数据集包含六十九个文件,涵盖SGE数据集及FICTURE分析的空间因子相关PMTiles文件等。...
-
Ooh_Na_Na_Relations_Based_OBO_Foundry本体关系抽取数据
数据集概述 本数据集包含从OBO Foundry、OLS等来源的本体中抽取的关系数据,原始内容采用CC0许可,衍生内容遵循原始来源许可。数据集共5个文件,涵盖本体关系的元数据、详细摘要、摘要、完整数据压缩包及样本数据,可用于语义网络关系分析。 文件详解 文件名称:relations_metadata.json 文件格式:JSON...
-
Guibemantis_Based马达加斯加安达西贝地区植食性蛙类多样性研究数据集2023
数据集概述 本数据集来自关于马达加斯加安达西贝地区植食性蛙类(Guibemantis属)的研究论文,包含该区域两栖动物热点的物种多样性、共现模式及新物种描述相关数据,涉及基因序列、测量数据、音频记录等12个文件,支持两栖动物分类与生态研究。 文件详解 序列与测量数据文件...
-
cartloader_Based_Vizgen_MERSCOPE空间转录组分析结果_PMTiles格式
数据集概述 本数据集是cartloader公开教程的成果,基于Vizgen MERSCOPE小鼠空间转录组数据集,展示如何使用cartloader工具包将空间转录组数据转换为网络优化的空间索引PMTiles格式,用于下游分析、交互式网络可视化和跨平台数据共享。包含69个文件,主要为PMTiles格式的空间数据文件及配套的信息、模型和配置文件。 文件详解...
-
TweetsCOV19_Geolocation_Part1_2019_2020_社交媒体地理数据
数据集概述 本数据集为TweetsCOV19地理定位数据集第一部分,涵盖2019年10月至2020年4月期间的推特地理信息。数据以制表符分隔格式存储,包含推特ID、经纬度、国家、州、县、城市等关键字段,共1个压缩文件,可用于分析特定时期推特内容的地理分布特征。 文件详解 文件名称:TweetsCOV19Part1geolocation.zip...
-
Local_Geohistory_Project_Based_康涅狄格州法律索引数据1789_1943
数据集概述 本数据集是Local Geohistory Project的一部分,旨在传播康涅狄格州的法律索引数据,涵盖1789年至1943年的私人和特殊法律。这类法律针对特定个人、实体或地区,是新英格兰地区调整市政边界和政府形式的主要方式。数据集包含一个TSV格式的法律索引文件,无法律全文或链接。 文件详解 文件名称:law-indexes-...
-
Francisella_tularensis_Based_临床样本全基因组捕获测序数据_原始与组装数据
数据集概述 本数据集包含土拉弗朗西斯菌的RNA寡核苷酸诱饵设计文件及17个样本的基因组组装数据。诱饵设计针对该菌染色体和质粒,排除人类同源序列;组装数据含17个样本的基因组序列及组装统计元数据,支持从临床样本直接进行全基因组捕获测序的验证与应用研究。 文件详解 Francisella_tularensis_RNA_baits_INSA_PT.tsv...
-
GloBI_Based_西西伯利亚泥炭地Andromeda_polifolia真菌寄生与腐生关系索引数据
数据集概述 本数据集收录西西伯利亚隆起泥炭地中,沼泽迷迭香(Andromeda polifolia)相关真菌寄生生物与腐生生物的互作数据,通过Global Biotic Interactions(GloBI)平台索引,包含真菌群落组成、互作关系及生境关联信息,共3个文件,可用于泥炭地生态系统真菌-植物互作及碳循环研究。 文件详解 README.md...
-
abxbug_GitLab_Based_抗生素对肠道细菌_collateral_damage_研究完整数据
数据集概述 本数据集包含论文“Unravelling the collateral damage of antibiotics on gut bacteria”所需的全部实验数据,支持复现论文中的分析结果。数据涉及抗生素对肠道细菌影响的实验结果、化合物信息、MIC值等,涵盖原始实验数据和处理后数据,共四十七个文件,覆盖多种格式。 文件详解...
-
CFHP_Patrimonio_Digital_Complutense_Hernández_Pacheco_地质摄影集数字化元数据
数据集概述 本数据集为Hernández-Pacheco摄影集的数字化资源,包含地质学家Eduardo Hernández-Pacheco于1900-1950年教学研究中拍摄的1510张玻璃版正片的数字化影像及元数据,经马德里康普顿斯大学团队整理、标准化及地理定位处理,存储于该校数字遗产平台。 文件详解 说明文档 文件名称:readme-es-...
-
俄语词义消歧语料库_RuSemCor
数据集概述 该数据集是一个为俄语设计的词义消歧语料库,通过WordNet进行语义标注,属于链接开放数据云(LLOD cloud)资源。包含标注数据文件和语料库归档文件,支持自然语言处理领域的词义消歧研究。 文件详解 文件名称: sense_annotations.tsv 文件格式: TSV (.tsv) 字段映射:...
-
糖尿病与其他肾脏疾病患者尿液拉曼光谱数据集
数据集概述 本数据集包含糖尿病及多种肾脏疾病患者、健康志愿者和尿液分析对照的尿液原始拉曼光谱数据,以及对应的匿名元数据。光谱数据通过Agiltron PeakSeeker PRO-785光谱仪采集,每个样本含十次独立扫描重复,为研究尿液光谱与疾病状态的关联提供基础数据。 文件详解 该数据集包含四个文件,具体说明如下: - 数据文件(TSV格式): -...



