找到1,512个数据集

标签: 数据清洗

过滤结果
  • Bionomia_Linked_马达加斯加大戟属标本采集者与鉴定者关联数据

    2026年1月21日   

    数据集概述 本数据集是与论文“A propos de quelques noms oubliés dans le genre Euphorbia L. (Euphorbiaceae) à Madagascar”相关的自然历史标本数据,关联了标本的采集者和鉴定者信息。数据由Bionomia志愿者Scribes基于Global Biodiversity...
    packageimg
  • PathOS_Horizon_Europe_开放科学学术影响范围综述数据集

    2026年1月21日   

    数据集概述 本数据集是PathOS Horizon Europe项目中开放科学学术、经济和社会影响系列研究的一部分,对应“开放科学的学术影响:范围综述”研究。数据包含两个阶段的研究成果:第一阶段学术数据库检索,第二阶段基于第一阶段结果的自动滚雪球检索及手动灰色文献检索,共收录485项研究的相关信息,包含五个文件。 文件详解 核心数据文件(CSV)...
    packageimg
  • DH_ATLAS_Based_2025年3月数据马拉松调查响应数据v1_0

    2026年1月21日   

    数据集概述 本数据集包含2025年3月26日在ATLAS Workshop举办的数据马拉松的调查响应结果,以CSV格式存储于压缩文件中。数据涵盖参与者的文本反馈和评估分数,是了解该数据马拉松活动参与情况与反馈的核心资料。 文件详解 压缩文件 文件名称:dh-atlas/datathon-survey-responses-v1.0.zip...
    packageimg
  • Wikidata_Based_2025年教皇选举红衣主教选举人查询与验证数据

    2026年1月20日   

    数据集概述 本数据集为博客文章的补充材料,围绕“2025年教皇选举的红衣主教选举人是谁?这是维基数据的典型问题吗?”展开,包含维基数据查询结果、德语维基百科人工整理表格及OpenRefine处理项目,共4个文件,用于红衣主教选举人信息的查询、验证与交叉核对。 文件详解...
    packageimg
  • bioRxiv_based_果蝇成虫拥挤体型依赖适合度效应原始数据_2025

    2026年1月20日   

    数据集概述 本数据集包含果蝇成虫拥挤体型依赖适合度效应研究的原始数据及分析代码,对应Rao等人2025年发表于bioRxiv的研究论文。数据用于验证“体型越大未必越有利”的假设,记录了不同拥挤条件下果蝇体型与适合度的关联实验结果,共包含2个文件。 文件详解 原始数据文件...
    packageimg
  • Dryad_Based_定向移动猎物逃逸理论模型及奇努克鲑鱼幼鱼实验测试数据

    2026年1月20日   

    数据集概述 本数据集包含定向移动猎物逃逸理论模型的扩展研究及奇努克鲑鱼幼鱼的行为实验测试数据。研究基于经济逃逸理论,分析不同捕食者经验的幼鱼(孵化场、野生上游、野生下游群体)在捕食者 cues 下的移动速度变化,验证敏化假说,共含5个文件。 文件详解 文档类文件 文件名称:README_JAE.docx 文件格式:DOCX...
    packageimg
  • Crossref_Based_2024_dump机构ROR匹配错误基准数据集

    2026年1月20日   

    数据集概述 本数据集包含326条Crossref 2024年4月数据中机构名称与ROR ID匹配错误的记录,经人工校验筛选,排除部分低参考价值的特殊问题条目。数据可作为机构匹配算法的基准测试集,用于评估学术数据中机构名称与ROR ID的匹配准确性。 文件详解 文件名称:crossref_2024_ror_false_matches.tsv...
    packageimg
  • Bionomia_Linked_澳大利亚露尾甲亚科标本采集者与鉴定者关联数据

    2026年1月20日   

    数据集概述 本数据集为澳大利亚露尾甲亚科(Coleoptera: Nitidulidae)的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据基于GBIF聚合的标本数据,由Bionomia平台志愿者标注生成,包含引用、发生记录、用户信息等9个文件,采用Frictionless Data数据包格式组织。 文件详解 核心数据文件...
    packageimg
  • Bionomia_Linked_曼尼托巴博物馆自然历史标本采集者鉴定者关联数据

    2026年1月20日   

    数据集概述 本数据集为曼尼托巴自然与人博物馆的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据集,采用Frictionless Data数据包格式组织,包含9个文件。 文件详解 压缩文件包(共8个)...
    packageimg
  • Bionomia_GBIF_Source_CMNH鸟类标本采集者鉴定者关联数据

    2026年1月20日   

    数据集概述 本数据集为CMNH鸟类标本馆(CMNH Birds Collection)的标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者在Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据集生成,采用Frictionless Data数据包格式,包含9个文件。 文件详解 归档文件(共8个,格式均为ZIP)...
    packageimg
  • LUC_impact_Brazil_Based巴西土地利用变化影响评估输入数据

    2026年1月20日   

    数据集概述 本数据集包含运行LUC-impact-Brazil相关脚本所需的输入数据,支持生物多样性数据库的分类与地理清洗、伪缺失数据生成及物种分布模型校准验证。数据集共6个文件,涵盖生物多样性、地理空间等相关数据。 文件详解 SALVE.xlsx:XLSX格式,为生物多样性相关数据文件 Presence.xlsx:XLSX格式,为物种存在数据文件...
    packageimg
  • Zenodo_Dataset_农业研究中无人机系统应用调查数据与代码_2024

    2026年1月20日   

    数据集概述 本数据集包含支持《农业研究中无人机系统(UAS)应用》研究的调查数据与分析代码,通过在线调查和面对面访谈收集农业研究者对UAS技术的使用情况,涵盖调查原始数据、编码手册、访谈记录及数据处理与分析脚本,为农业技术应用研究提供结构化参考资料。 文件详解 数据文件 文件名称:Results_Ag_Drones_2021_Survey.csv...
    packageimg
  • AsanteTwiSenti_Based_加纳阿桑特语推文多语言情感标注数据集

    2026年1月19日   

    数据集概述 本数据集为加纳阿桑特语推文情感标注语料库AsanteTwiSenti,包含九千五百零七条手动标注的推特数据,标注类别涵盖积极、消极、中性、加纳皮钦语、多语言及单语言。数据集共六个文件,支持非洲本土语言情感分析研究,无训练测试或原始处理数据拆分。 文件详解 数据文件(共5个)...
    packageimg
  • IntoValue_Based_德国大学医学中心临床试验交叉注册监测研究数据集

    2026年1月19日   

    数据集概述 本数据集为德国大学医学中心(UMC)2009-2017年完成的临床试验交叉注册监测研究相关数据,包含中间数据集、最终交叉注册对数据集及人工验证结果三类文件,支持临床试验交叉注册的识别、验证与分析,共8个文件。 文件详解 中间数据集(.rds格式) 文件名称:trn-registry-data.rds、title-...
    packageimg
  • E_Wallet_Usage_Intentions_Indonesia_研究数据

    2026年1月19日   

    数据集概述 本数据集围绕印尼电子钱包使用意向展开,核心探究欺诈恐惧与信任因素对使用意向的影响,包含一份已完成数据清洗的文件,可用于分析相关消费行为驱动因素。 文件详解 文件名称:Data Cleaning Finished.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段信息,为已完成数据清洗的电子钱包使用意向相关数据集 适用场景...
    packageimg
  • GBIF_Based_全球生物多样性标本记录趋势分析与预测数据_Version2

    2026年1月19日   

    数据集概述 本数据集包含分析和预测全球生物多样性信息设施(GBIF)标本记录趋势的代码与数据,覆盖脊索动物门、节肢动物门和植物界三大类群。内容包括数据清洗、异常检测、主分析及基于历史快照的预测,对应论文《Global Sampling Decline Erodes Science Potential of Natural History...
    packageimg
  • Bionomia_Linked_美洲锥蝽标本采集者与鉴定者关联数据_package

    2026年1月18日   

    数据集概述 本数据集为美洲锥蝽标本数据的采集者与鉴定者关联数据,基于CEPAVE实验室美洲锥蝽标本数据,由Bionomia志愿者标注生成,包含标本采集者、鉴定者的关联信息及相关问题记录,以Frictionless Data包格式组织,共9个文件。 文件详解 数据文件 文件名称:datapackage.json 文件格式:JSON...
    packageimg
  • EPILOBEE_Based_欧盟蜜蜂季节性死亡率流行病学分析数据2012_2014

    2026年1月18日   

    数据集概述 本数据集是EPILOBEE项目(欧盟17国蜜蜂流行病学监测项目)的季节性死亡率数据,基于2012年秋至2014年夏的统一协议收集,经数据清洗和分类处理而成,包含欧洲蜂场的4758条观测记录,用于分析蜂群死亡率与疾病流行、养蜂环境及地理分布的关联。 文件详解 文件名称:883eax1-sup-0001.xlsx 文件格式:XLSX...
    packageimg
  • Bionomia_Based_路易斯安那州立大学苔藓植物标本采集者与鉴定者关联数据包

    2026年1月18日   

    数据集概述 本数据集为路易斯安那州立大学雪莉·C·塔克植物标本馆苔藓植物标本的采集者与鉴定者关联数据,由Bionomia志愿者标注生成,原始标本数据来自全球生物多样性信息设施(GBIF)。数据以Frictionless Data数据包格式组织,包含9个文件,涵盖关联归属、问题日期记录、文献引用等信息。 文件详解 关联归属文件...
    packageimg
  • Bionomia_Based_世界Ooderella属修订研究采集者与鉴定者关联数据

    2026年1月18日   

    数据集概述 本数据集为《世界Ooderella属修订研究》关联的自然历史标本采集者与鉴定者数据,包含由Bionomia志愿者标注的归属信息,基于全球生物多样性信息机构(GBIF)聚合的标本数据构建,以Frictionless Data数据包格式组织,共9个文件。 文件详解 压缩文件(ZIP格式,共8个)...
    packageimg