找到1,271个数据集

标签: 数据清洗

过滤结果
  • Flipkart印度手机列表数据集2024年5月-yesshivam007

    2025年4月23日   

    Flipkart印度手机列表数据集2024年5月-yesshivam007 数据来源:互联网公开数据 标签:Flipkart,手机,印度,产品列表,数据清洗,数据分析,EDA 数据概述:...
    packageimg
  • 数据预处理数据集PreprocessingDataDataset-uselessbrainan

    2025年4月23日   

    数据预处理数据集PreprocessingDataDataset-uselessbrainan 数据来源:互联网公开数据 标签:数据预处理,数据集,数据清洗,特征工程,机器学习,数据处理,统计分析,数据科学 数据概述: 该数据集包含用于数据预处理和特征工程的数据样本,适用于机器学习和统计分析任务。主要特征如下:...
    packageimg
  • 缺失值填充特征数据集ImputedFeaturesDataset-arghakamalsamanta

    2025年4月23日   

    缺失值填充特征数据集ImputedFeaturesDataset-arghakamalsamanta 数据来源:互联网公开数据 标签:数据预处理,缺失值填充,特征工程,机器学习,数据清洗,统计分析,数据科学,数据建模 数据概述: 该数据集包含了经过缺失值填充处理的特征数据,记录了原始数据集中缺失值的填充方法和填充后的特征值。主要特征如下:...
    packageimg
  • 笔记本电脑数据清洗原始数据集-2023-rootpi3

    2025年4月23日   

    笔记本电脑数据清洗原始数据集-2023-rootpi3 数据来源:互联网公开数据 标签:笔记本电脑,数据清洗,网络爬虫,Selenium,数据预处理,EDA,MySQL,Pandas 数据概述:...
    packageimg
  • Pandas操作数据集DatasetforPandasOperations-akalyasubramanian

    2025年4月23日   

    Pandas操作数据集DatasetforPandasOperations-akalyasubramanian 数据来源:互联网公开数据 标签:数据处理,Pandas,数据集,数据分析,Python,机器学习,数据清洗,数据科学 数据概述: 该数据集专为Pandas操作设计,包含了一系列用于练习和测试Pandas数据操作技能的数据。主要特征如下:...
    packageimg
  • 性别预测姓名数据集GenderPredictionbyNameDataset-franjmartin21

    2025年4月23日   

    性别预测姓名数据集GenderPredictionbyNameDataset-franjmartin21 数据来源:互联网公开数据 标签:姓名,性别预测,数据集,人口统计,机器学习,自然语言处理,数据清洗,分类分析 数据概述:该数据集包含来自多个来源的姓名和对应的性别信息,主要用于性别预测分析。主要特征如下:...
    packageimg
  • 数值数据集用于练习缺失值填充NumDatasetforPracticeMissingValuesFilling-fadool

    2025年4月23日   

    数值数据集用于练习缺失值填充NumDatasetforPracticeMissingValuesFilling-fadool 数据来源:互联网公开数据 标签:数值数据集,缺失值填充,数据处理,数据分析,数据科学,机器学习,统计学,数据清洗 数据概述: 该数据集包含用于练习和学习缺失值填充技术的数值数据,适用于数据处理和数据分析等任务。主要特征如下:...
    packageimg
  • 俄罗斯Sberbank房价市场修正数据集-matthewa313

    2025年4月23日   

    俄罗斯Sberbank房价市场修正数据集-matthewa313 数据来源:互联网公开数据 标签:Sberbank,房价,市场数据,俄罗斯,数据清洗,数据修正 数据概述: 本数据集是针对Sberbank俄罗斯房价市场竞赛中的训练数据进行清洗修正后的版本。原始数据中存在噪声和错误,这些不应出现在训练集中,因此已被移除。数据清洗的具体规则如下:...
    packageimg
  • 电影数据清洗后数据集CleanedDatasetMovie-mdfaishalahmedrudroo

    2025年4月23日   

    电影数据清洗后数据集CleanedDatasetMovie-mdfaishalahmedrudroo 数据来源:互联网公开数据 标签:电影,数据集,数据分析,影视研究,机器学习,内容分析,娱乐行业,数据清洗 数据概述: 该数据集包含经过清洗和整理的电影相关数据,记录了各类电影的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。...
    packageimg
  • Kiji数据库格式化数据集KijiFormatterDatabaseDataset-mrkmakr

    2025年4月23日   

    Kiji数据库格式化数据集KijiFormatterDatabaseDataset-mrkmakr 数据来源:互联网公开数据 标签:数据库,数据格式化,数据集,Kiji,数据清洗,数据处理,数据科学,数据管理 数据概述:该数据集包含来自Kiji数据库的格式化数据,记录了Kiji数据库中的数据项及其格式化后的结果。主要特征如下:...
    packageimg
  • 列名规范化数据集ColumnNamesAreCoolDataset-jiakangchen2

    2025年4月23日   

    列名规范化数据集ColumnNamesAreCoolDataset-jiakangchen2 数据来源:互联网公开数据 标签:数据规范化,列名标准化,数据集,数据清洗,数据管理,数据处理,数据科学,机器学习 数据概述: 该数据集专注于列名规范化与标准化的实践,记录了不同数据集中列名的命名规范及处理方法。主要特征如下:...
    packageimg
  • Audible有声书评论数据AudibleUncleanedDateChangedDataset-shresthajeevan

    2025年4月23日   

    Audible有声书评论数据AudibleUncleanedDateChangedDataset-shresthajeevan 数据来源:互联网公开数据 标签:有声书,评论数据,自然语言处理,文本分析,情感分析,时间序列,数据清洗,Audible 数据概述:...
    packageimg
  • 正态分布与Z-Score异常值剔除数据集-panagiotisprassas

    2025年4月23日   

    正态分布与Z-Score异常值剔除数据集-panagiotisprassas 数据来源:互联网公开数据 标签:异常值检测,正态分布,Z-Score,数据清洗,机器学习,统计分析,数据预处理,数据科学 数据概述: 该数据集包含模拟生成的符合正态分布的数据,并结合Z-Score方法进行异常值检测与剔除。主要特征如下: 时间跨度:...
    packageimg
  • 基础数据集Back-to-BasicsDataset-hypdeb

    2025年4月23日   

    基础数据集Back-to-BasicsDataset-hypdeb 数据来源:互联网公开数据 标签:基础数据,数据集,统计分析,机器学习,教育研究,数据清洗,数据处理,数据科学 数据概述: 该数据集包含基础性的数据信息,适用于数据科学和统计分析的学习与训练。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能包含多年数据。...
    packageimg
  • 里约热内卢州波尔图阿莱格雷市COVID-19疫情数据集-decao88

    2025年4月23日   

    里约热内卢州波尔图阿莱格雷市COVID-19疫情数据集-decao88 数据来源:互联网公开数据 标签:COVID-19,波尔图阿莱格雷,里约热内卢州,巴西,疫情数据,公共卫生,数据清洗 数据概述:...
    packageimg
  • 房价预测清洗数据集-abraham8614

    2025年4月23日   

    房价预测清洗数据集-abraham8614 数据来源:互联网公开数据 标签:房价预测,房地产,数据集,数据清洗,机器学习,房价分析,经济学,城市规划 数据概述: 该数据集包含经过清洗和预处理的房价数据,记录了不同地区的房屋价格及相关特征。主要特征如下: 时间跨度:数据记录的时间范围为近期,具体年份信息在数据集中有所体现。...
    packageimg
  • 样本列数据集SampleColumnsDataset-avanishgadhikar

    2025年4月23日   

    样本列数据集SampleColumnsDataset-avanishgadhikar 数据来源:互联网公开数据 标签:数据集,数据列,数据分析,数据清洗,机器学习,数据预处理,数据科学,统计学 数据概述:该数据集包含来自多个来源的样本列数据,记录了不同类型的数据列及其属性。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据来源。...
    packageimg
  • 沙滩排球比赛结果与球员数据集-2011至2021年-jessemostipak

    2025年4月23日   

    沙滩排球比赛结果与球员数据集-2011至2021年-jessemostipak 数据来源:互联网公开数据 标签:沙滩排球,比赛结果,球员详情,统计分析,FIVB,AVP,数据清洗,数据可视化,R语言,TidyTuesday 数据概述: 本数据集包含来自Adam...
    packageimg
  • 机器学习最终数据集FinalDatasetforMachineLearning-iremorhan

    2025年4月23日   

    机器学习最终数据集FinalDatasetforMachineLearning-iremorhan 数据来源:互联网公开数据 标签:机器学习,数据集,数据清洗,特征工程,模型训练,数据分析,人工智能,数据科学 数据概述: 该数据集是一个为机器学习项目设计的综合性数据集,包含了多种类型的数据,旨在为模型训练和评估提供全面的数据支持。主要特征如下:...
    packageimg
  • 全球Top1000YouTube频道统计分析数据集-mabelhsu

    2025年4月23日   

    全球Top1000YouTube频道统计分析数据集-mabelhsu 数据来源:互联网公开数据 标签:YouTube,频道统计,订阅者,国家分布,内容类别,视频分析,数据清洗 数据概述: 本数据集包含全球排名前1000的YouTube频道的详细信息。原始数据来自COMPUTINGVICTOR - Top 1000 Youtubers...
    packageimg