找到1,312个数据集

标签: 数据清洗

过滤结果
  • Twitter与Facebook数据挖掘及情感分析数据集

    2025年12月11日   

    数据集概述 本数据集围绕Twitter与Facebook平台的数据挖掘及情感分析主题构建,包含从Google Scholar获取的相关学术文献元数据,涵盖文献标题、作者、发表年份、被引次数等核心信息,为该领域研究提供文献基础数据。 文件详解 数据集核心文件:...
    packageimg
  • 英国慢性肾病成年患者非正式照护者认知行为疗法自助干预偏好数据集2022

    2025年12月10日   

    数据集概述 本数据集为英国慢性肾病成年患者非正式照护者的在线横断面调查数据,包含照护者特征、被照护者特征、认知行为疗法自助干预偏好及照护者心理健康(抑郁、焦虑、压力)数据,还提供了数据清洗与分析的R代码,支持相关研究的复现与扩展。 文件详解 ENTWINE_ESR14_Kidney Carer Survey...
    packageimg
  • 法国青少年LGBT正面言论意图数据集2020

    2025年12月10日   

    数据集概述 本数据集基于计划行为理论,包含2020年针对法国17-25岁青少年开展的LGBT正面言论意图定量调查数据(样本量372)。涵盖意图、态度、规范感知等核心变量,为研究青少年相关行为意向提供数据支持。 文件详解 文件名称:Intention de parler positivement des LGBT chez les jeunes. Une...
    packageimg
  • 比利时自动驾驶公共交通可持续采用研究补充材料数据集

    2025年12月10日   

    数据集概述 本数据集是论文《Encouraging a sustainable adoption of autonomous vehicles for public transport in Belgium: citizen acceptance, business models and policy...
    packageimg
  • 国际交通能源建模开放数据与协调交通数据库

    2025年12月10日   

    数据集概述 该数据集包含国际交通能源建模(iTEM)开放数据库的详细信息,是1970年至今历史值的协调交通数据集。通过开放数据和开放代码两大特征提升透明度,为交通能源研究提供标准化数据支持。 文件详解 iTEM_Open_Data_Rule_Book.pdf:PDF格式文档,包含数据集的规则说明、数据清洗步骤、技术定义等背景信息。 iTEM...
    packageimg
  • 晚三叠世四足动物多样性纬度变化的气候驱动因素数据集

    2025年12月9日   

    数据集概述 本数据集围绕晚三叠世四足动物多样性的纬度分布模式展开,通过对古生物学数据库的出现数据进行采样标准化,结合古气候模型模拟,分析古气候对主要四足动物类群纬度分布的影响,探索晚三叠世四足动物多样性与现代纬度生物多样性梯度的差异。 文件详解 数据处理代码文件: cleaning_code.R:...
    packageimg
  • 乌干达马莱氏诱捕2014_2015背景数据集

    2025年12月9日   

    数据集概述 本数据集为乌干达2014-2015年马莱氏诱捕项目的背景数据,涵盖基巴莱国家公园热带森林中飞行昆虫诱捕相关的天气、植被、诱捕点地图与描述、876份昆虫样本数据及数据处理脚本,为昆虫诱捕研究提供基础支撑。 文件详解 Uganda Malaise trapping 2014–2015 background...
    packageimg
  • 看护者主导与治疗师主导培训项目结果去标识化数据集

    2025年12月8日   

    数据集概述 本数据集为看护者主导与治疗师主导两种培训项目结果的去标识化数据,包含原始数据、处理后数据及变量编码说明,可用于对比两种培训模式的效果差异。 文件详解 文件名称: Variable Codes _Key variables.pdf 文件格式: PDF (.pdf) 内容说明: 可能包含数据集中关键变量的编码规则和定义 文件名称: De-...
    packageimg
  • 科克大学学院研究数据管理调查数据集

    2025年12月8日   

    数据集概述 本数据集为科克大学学院(UCC)研究数据管理调查的成果,旨在了解校内研究数据管理活动的范围、资源与技能缺口,明确研究数据服务的定位,为构建数据管理网络、制定技能发展计划及确定未来数据管理模式提供依据。 文件详解 文档类文件:...
    packageimg
  • 欧洲电网频率预处理时间序列数据集2020_2023

    2025年12月7日   

    数据集概述 本数据集提供2020-2023年欧洲电网三个同步区域(含大陆欧洲、北欧)的频率预处理时间序列数据,延续原2012-2021数据集的预处理方法,确保数据一致性与可比性,为电网频率相关研究提供标准化数据支持。 文件详解 脚本文件(scripts.zip):...
    packageimg
  • 深度对海洋生物多样性的影响_手稿的发生记录数据集

    2025年12月6日   

    数据集概述 该数据集是为《深度对海洋生物多样性的影响》手稿制作的最终发生记录数据集,包含大西洋及地中海区域鲭形目、鳕形目和颌针鱼目鱼类的二维和三维发生记录,经分类学整合与深度数据清洗处理。 文件详解 文件名称: FinalOccurrenceDataset.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • GitHub_X_COBOL_Based_COBOL开源仓库数据完整集合

    2025年12月6日   

    数据集概述 该数据集包含从GitHub挖掘的84个COBOL开源仓库数据,含项目开发周期元数据及1255个COBOL文件,支持COBOL遗留系统现代化、代码特性研究及开发工具构建,为COBOL实证研究提供数据基础。 文件详解 文件名称: Information_Of_Repo.xlsx,文件格式: XLSX,可能包含84个COBOL仓库的元数据信息...
    packageimg
  • MSDS_Probability_Based_多领域概率数据科学分析完整数据

    2025年12月5日   

    数据集概述 该数据集是一组经过轻度清洗的公开可用数据集合,涵盖房地产、教育、销售、执法、健康、基因组、学术资助及文学等多个领域,以压缩包形式提供,为多主题数据分析实践提供基础支持。 文件详解 文件名称: data.zip 文件格式: ZIP压缩包 包含内容:...
    packageimg
  • 气候变化适应中防洪与搬迁选择公众支持数据集2024

    2025年12月5日   

    数据集概述 该数据集包含支撑论文《Choosing to protect: Public support for flood defense over relocation in climate change adaptation》的调查工具、原始数据及分析代码,涉及德国与美国公众对气候变化适应策略的偏好,为相关研究提供实证数据支持。 文件详解...
    packageimg
  • 芝加哥市土壤铅含量与儿童血铅水平关联研究数据集

    2025年12月5日   

    数据集概述 该数据集围绕芝加哥市土壤铅含量与儿童血铅水平的关联展开,包含研究相关的代码文件、说明文档及数据压缩包,为探究土壤铅对血铅水平的预测作用提供数据支持。 文件详解 README.md:Markdown格式说明文档,包含项目背景、环境搭建步骤及数据来源指引等内容 analysis.Rmd:R...
    packageimg
  • 发展中国家ICT对收入不平等影响数据集1990_2021

    2025年12月5日   

    数据集概述 该数据集包含1990至2021年间130个发展中国家的年度数据,核心围绕信息通信技术(ICT)对收入不平等的影响展开,涵盖基尼系数、人均GDP、互联网接入率等经济社会指标,数据经清洗与标准化处理。 文件详解 文件名称: Metadata2.pdf 文件格式: PDF 内容:...
    packageimg
  • 论文第三章补充文件集

    2025年12月4日   

    数据集概述 本数据集为论文第三章的补充文件集,包含经合并、清洗的生物元数据文件与物种数据文件,以及一个压缩包文件,为论文相关研究提供数据支持。 文件详解 该数据集包含5个文件,具体说明如下: - 数据文件 (.csv 格式): - Port_Hacking_metadata_merged_cleaned.csv: 包含合并、清洗后的Port...
    packageimg
  • CNJ_TPU_Codes_Based_巴西司法委员会TPU编码整合完整数据

    2025年12月4日   

    数据集概述 该数据集是对巴西国家司法委员会(CNJ)提供的TPU编码(涉及主题、动议和类别)进行处理与整合的结果。通过脚本处理原始Excel文件,完成数据清洗、编码转换、重复项移除等步骤,最终生成按类别划分的CSV文件及统一的Excel表格,为司法数据标准化提供支持。 文件详解 原始数据目录(LAKE/):...
    packageimg
  • NASA五千年日食数据库大数据分析数据集

    2025年12月4日   

    数据集概述 本数据集围绕NASA提供的公元前2000年至公元3000年五千年间的日食数据展开大数据分析,涵盖数据清洗、预处理、探索性数据分析、分布拟合及机器学习等环节,提供经清洗的可用数据库及分析成果,支持日食相关参数的统计与分析。 文件详解 文件名称:README.md 文件格式:Markdown(.md)...
    packageimg
  • Soltis实验室植物学2025工作坊数据

    2025年12月4日   

    数据集概述 该数据集是Soltis实验室Botany 2025工作坊“数字化标本馆数据在研究中的应用:探索、分类学与生态学”所需的数据文件夹,包含7个工作流程目录的压缩文件,需解压后使用。 文件详解 文件名称: data.zip 文件格式: ZIP压缩包 解压后包含目录: 01_download/: 可能用于数据下载相关文件 02_cleaning/:...
    packageimg