找到1,512个数据集

标签: 数据清洗

过滤结果
  • worms_basionyms_raw_20241203_xlsx_生物分类原始数据

    2026年1月18日   

    数据集概述 本数据集为worms_basionyms_raw_20241203.xlsx文件,包含生物分类领域的原始数据,具体内容未提供详细描述。数据集仅含一个文件,无目录结构,未进行训练/测试、数据/标签或原始/处理数据的拆分,主要用于生物分类相关的数据处理场景。 文件详解 文件名称:worms_basionyms_raw_20241203.xlsx...
    packageimg
  • Sperm_morphology_Based_鸣禽精子头部形态与游动速度关联研究数据

    2026年1月18日   

    数据集概述 本数据集为鸣禽精子头部形态与游动速度关联的比较研究数据,通过扫描电镜量化36种鸣禽的种间及种内精子头部形态差异,结合系统发育比较方法分析其与精子游动速度、额外配对后代频率的关系,包含原始数据与分析脚本。 文件详解 数据文件 文件名称:SEM_rawdata.xlsx 文件格式:XLSX...
    packageimg
  • China_Industrial_Water_Use_Data_高分辨率多尺度数据集

    2026年1月18日   

    数据集概述 本数据集提供中国高分辨率多尺度工业用水的完整数据及研究代码,包含微观企业用水数据、区域行业汇总数据、宏观统计数据、水卫星账户数据和区域间投入产出表,覆盖1998-2014年,支持工业用水管理、环境影响及虚拟水贸易等研究。 文件详解 Data文件夹(压缩包) 文件名称:Water usage.dta 文件格式:DTA...
    packageimg
  • HPGs_measurement_data_repository_数据仓库_原始数据

    2026年1月18日   

    数据集概述 本数据集为HPGs测量数据仓库,包含1个Excel文件,未划分训练/测试集、数据/标签集或原始/处理数据集,无额外目录结构,无说明文档或内容预览,核心为HPGs相关测量数据的存储集合。 文件详解 文件名称:HPGs measurement data_repository.xlsx 文件格式:XLSX...
    packageimg
  • Tongji_AI_Based_同济大学人工智能跨学科研究论文数据2004_2023

    2026年1月18日   

    数据集概述 本数据集为同济大学2004-2023年发表的人工智能跨学科研究论文数据,基于Web of Science核心合集检索,经去重和数据清洗后保留2783篇有效论文,涵盖AI相关18个关键词领域,可用于分析该校AI研究的学科融合趋势与发展状况。 文件详解 文件名称:(2004-2023)Tongji University's...
    packageimg
  • Bionomia_Based_Ambotingis属分类学标本采集者与鉴定者关联数据

    2026年1月18日   

    数据集概述 本数据集包含与《Ambotingis属分类学综述》相关的自然历史标本数据,关联了标本的采集者和鉴定者信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集构建,采用Frictionless Data数据包格式组织,共包含9个文件。 文件详解 数据集核心文件...
    packageimg
  • Bionomia_Based_CESJ植物标本馆采集者与鉴定者关联数据_package

    2026年1月18日   

    数据集概述 本数据集为CESJ-Herbário Leopoldo Krieger植物标本馆的自然历史标本数据,包含与采集者和鉴定者的关联信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,采用Frictionless Data数据包格式组织,共包含九个文件。 文件详解 压缩文件(共8个)...
    packageimg
  • Governance_Failure_Denial_高信任度民主政体治理失败否认研究复现数据

    2026年1月17日   

    数据集概述 本数据集为研究论文《高信任度民主政体中治理失败的否认》的完整复现资料,包含数据文件与代码文件。数据涵盖37个国家13年的腐败感知指数、制度质量指标等信息,代码文件实现数据清洗、回归分析及结果可视化,可用于复现论文中的定量分析结果与图表。 文件详解 数据文件 文件名称:V-Dem-CY-Core-v15.csv 文件格式:CSV...
    packageimg
  • GRU_Supplementary_material_7_生物收藏数据质量检查清单_2018

    2026年1月17日   

    数据集概述 本数据集是论文《Georeferencing for Research Use (GRU)》的补充材料7,包含生物收藏研究者和数据提供者在评估、清洗数据集时使用的带注释的数据质量检查清单,记录了参与者判断数据是否符合用途的具体项目。 文件详解 文件名称:oo_202857.docx 文件格式:DOCX...
    packageimg
  • EFSA_Based_食品饲料Glycoalkaloids风险评估与膳食暴露数据_2020版

    2026年1月12日   

    数据集概述 本数据集为欧洲食品安全局(EFSA)提交的食品饲料中Glycoalkaloids风险评估更新数据,包含原始发生数据集及膳食暴露评估附录表格,涉及食品饲料中Glycoalkaloids的存在数据、膳食暴露评估及相关统计对比,支持食品安全风险分析。 文件详解 文件名称:Glyco_Occ_Zenodo.csv 文件格式:CSV...
    packageimg
  • Impedance_Charge_Density_四参与者阻抗与电荷密度原始数据

    2026年1月15日   

    数据集概述 本数据集包含四位参与者的阻抗与电荷密度原始数据,以Excel文件形式存储。文件内每个工作表对应一位参与者和一个袖带(cuff)的所有通道数据,数据按阻抗、电荷密度顺序排列,可用于生物医学领域的电生理监测相关分析。 文件详解 文件名称:ChronicStabilityRawData_Revision.xlsx 文件格式:XLSX...
    packageimg
  • EFSA_DWH_Based_饲料中硝酸盐和亚硝酸盐含量原始数据_20191203

    2026年1月15日   

    数据集概述 本数据集包含两份文件,分别为Excel格式的附件表格和CSV格式的原始数据文件,记录了饲料中硝酸盐和亚硝酸盐的含量数据。原始数据提取自2019年12月3日EFSA数据仓库,遵循EFSA SSD模型,包含数据清洗过程中的问题说明及处理措施,为饲料安全相关研究提供基础数据支持。 文件详解 Annex_III_occurrence...
    packageimg
  • Open_Data_Repository_南内华达山脉年际积雪过程气候分析开放数据

    2026年1月15日   

    数据集概述 本数据集为“应对不确定水资源未来”开放数据仓库的一部分,聚焦南内华达山脉年际积雪过程的气候分析。包含气候模型数据、仪器观测数据、分析代码及说明文档,共八个文件,支持研究气候变化对积雪动态的影响,为水资源管理提供数据支撑。 文件详解 数据文件(.csv)...
    packageimg
  • Bionomia_Linked_UNAB昆虫博物馆鳃金龟科标本采集者鉴定者关联数据

    2026年1月15日   

    数据集概述 本数据集为UNAB昆虫博物馆中央分类收藏中鳃金龟科(Melolonthidae)标本的采集者与鉴定者关联数据,由志愿者通过Bionomia平台基于GBIF聚合的标本数据标注生成。数据以Frictionless Data数据包格式组织,包含9个文件,涵盖关联归属、问题日期记录、用户信息等内容,可用于昆虫分类学标本的采集与鉴定人员关联分析。...
    packageimg
  • Bee_phenology_Based_蜜蜂物候气候变异与功能性状驱动因素分析数据

    2026年1月15日   

    数据集概述 本数据集为科罗拉多落基山脉九年67种蜜蜂物候研究的支撑数据,包含蜜蜂观测、功能性状、气候数据及分析代码,用于探究气候变异与功能性状对蜜蜂物候的驱动作用,共14个文件,涵盖数据、文档、代码三类。 文件详解 文档文件(4个)...
    packageimg
  • Bionomia_Linked_Andrena属早期分化亚属采集者与鉴定者关联数据

    2026年1月15日   

    数据集概述 本数据集为《旧世界Andrena属蜜蜂早期分化亚属的采集者与鉴定者关联数据》,包含由Bionomia志愿者整理的自然历史标本关联信息,涉及采集者、鉴定者及标本数据的关联记录,支持昆虫分类学与生物多样性研究,共含9个文件。 文件详解 归档文件(Archive files)...
    packageimg
  • GECAD_SMARTGRID_2022_3太阳能发电预测竞赛_光伏与气象原始数据

    2026年1月15日   

    数据集概述 本数据集为2022-3太阳能发电预测竞赛发布的原始数据,包含光伏面板发电功率及邻近气象站监测数据,采样周期为五分钟。数据涵盖发电功率、温度、露点、气压、风向风速等13项指标,存在未处理的原始状态特征,可能包含错误、缺失值或系统读数故障导致的固定零值。 文件详解 文件名称:PV_firstRealease.xlsx 文件格式:XLSX...
    packageimg
  • GBIF_Bionomia_Pronotocrepini分类修订标本数据_2024

    2026年1月14日   

    数据集概述 本数据集包含与论文“Resurrection of the Pronotocrepini Knight”相关的自然历史标本数据,链接了标本的采集者和鉴定者信息。数据由Bionomia志愿者标注,基于GBIF聚合的标本数据,以Frictionless Data包格式组织,包含9个文件,支持昆虫分类学研究。 文件详解 数据文件...
    packageimg
  • Zytynska_Based_植物吸食昆虫兼性共生体代价与收益荟萃分析数据集2021

    2026年1月14日   

    数据集概述 本数据集为植物吸食昆虫(如蚜虫、粉虱、蝽类)携带兼性共生体的代价与收益荟萃分析结果,涵盖不同昆虫类群共生体对宿主生长、繁殖力及天敌抗性的影响,包含数据文件与分析代码,支持探究共生关系的情境依赖性及类群差异。 文件详解 数据文件(共2个,格式均为XLSX)...
    packageimg
  • Hintereisferner_Based阿尔卑斯冰川雪水当量测量与模型数据及处理资料

    2026年1月14日   

    数据集概述 本数据集包含重现相关论文所需的代码与数据,涉及阿尔卑斯山脉欣特里斯费尔纳冰川的雪水当量测量与模型研究。内容覆盖中子传感器数据、气象数据及模型输出的处理资料,可支撑从数据清洗、中子传感器校准到多维度分析的全流程复现。 文件详解 README.md 文件格式:MD...
    packageimg