找到1,271个数据集

标签: 数据清洗

过滤结果
  • 表格数据集

    2025年4月19日   

    表格数据集 数据来源:互联网公开数据 标签:表格数据,数据分析,数据探索,数据可视化,数据建模,数据处理,数据清洗,数据集示例,数据科学,机器学习 数据概述:...
    packageimg
  • 特征选择比赛数据集

    2025年4月19日   

    特征选择比赛数据集 数据来源:互联网公开数据 标签:特征选择,机器学习,分类模型,竞赛数据,高维数据,降维,数据理解,数据清洗 数据概述: 本数据集源于COMSYS...
    packageimg
  • 意大利房价数据集

    2025年4月18日   

    意大利房价数据集 数据来源:互联网公开数据 标签:房地产,意大利,房价,房租,地理分析,预测模型,数据清洗,数据分析 数据概述:...
    packageimg
  • IMDB电影与电视剧数据集

    2025年4月18日   

    IMDB电影与电视剧数据集 数据来源:互联网公开数据 标签:IMDB,电影,电视剧,评分,特征提取,机器学习项目,数据清洗 数据概述: 本数据集基于IMDB公开数据,包含从1990年至今上映的电影和电视剧信息,经过特征提取和数据清洗处理,形成以下四个数据文件: 1. names_ratings.csv:包含演员及评分信息。 2....
    packageimg
  • 芝加哥Cyclistic自行车共享项目骑行数据分析数据集-2022年3月至2023年2月

    2025年4月18日   

    芝加哥Cyclistic自行车共享项目骑行数据分析数据集-2022年3月至2023年2月 数据来源:互联网公开数据 标签:自行车共享,骑行数据,芝加哥,出行分析,用户行为,时间序列,数据清洗,Google,Capstone项目 数据概述:...
    packageimg
  • 提示重写三元组数据集

    2025年4月18日   

    提示重写三元组数据集 数据来源:互联网公开数据 标签:提示重写, LLM训练, 自然语言处理, 数据清洗, 字段映射, 机器学习, 人工智能 数据概述: 本数据集为用于大型语言模型(LLM)提示恢复竞赛的三元组数据集。原始数据集包含四个字段:prompt、original_text、input 和...
    packageimg
  • 印度假新闻清理数据集2016-2021

    2025年4月18日   

    印度假新闻清理数据集2016-2021 数据来源:互联网公开数据 标签:假新闻,清理数据,新闻分析,机器学习,文本分析,数据清洗,新闻真实性验证 数据概述:...
    packageimg
  • 图像性别分类数据集

    2025年4月18日   

    图像性别分类数据集 数据来源:互联网公开数据 标签:图像分类,性别识别,深度学习,计算机视觉,卷积神经网络,数据清洗,模型训练,准确性评估 数据概述:...
    packageimg
  • Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集

    2025年4月17日   

    Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集 数据来源:互联网公开数据 标签:邮件,Enron,垃圾邮件,非垃圾邮件,文本分类,自然语言处理,数据清洗,邮件分析 数据概述:...
    packageimg
  • Bellabeat智能设备用户行为分析数据集

    2025年4月17日   

    Bellabeat智能设备用户行为分析数据集 数据来源:互联网公开数据 标签:智能设备, 用户行为, 健康追踪, 活动分析, 数据清洗, 市场营销, 体重管理 数据概述:...
    packageimg
  • 巴西电商交易订单商品数据清洗与分析数据集-2016-2018

    2025年4月17日   

    巴西电商交易订单商品数据清洗与分析数据集-2016-2018 数据来源:互联网公开数据 标签:电商,巴西,订单,商品,销售,用户行为,市场分析,数据清洗 数据概述:...
    packageimg
  • 评分网站争议性评论数据集

    2025年4月17日   

    评分网站争议性评论数据集 数据来源:互联网公开数据 标签:评分网站,用户评论,争议分析,电影,视频游戏,机器学习,数据清洗 数据概述:...
    packageimg
  • 合成大数据集异常检测

    2025年4月17日   

    合成大数据集异常检测 数据来源:互联网公开数据 标签:异常检测,合成数据,收入分析,职业信息,质量保证,数据清洗,机器学习,算法评估 数据概述:...
    packageimg
  • 优步2014-2015年数据分析数据集

    2025年4月16日   

    优步2014-2015年数据分析数据集 数据来源:互联网公开数据 标签:优步,出行数据,时间序列,地理分布,数据分析,数据清洗,预测建模,数据预处理 数据概述:...
    packageimg
  • Fitbit用户活动与健康数据清洗整理数据集

    2025年4月15日   

    Fitbit用户活动与健康数据清洗整理数据集 数据来源:互联网公开数据 标签:Fitbit, 健身追踪, 活动数据, 健康数据, 用户行为, 数据清洗, 数据分析, 运动, 睡眠 数据概述:...
    packageimg
  • 世界新闻热点文章文本情感分析数据集2023

    2025年4月15日   

    世界新闻热点文章文本情感分析数据集2023 数据来源:互联网公开数据 标签:世界新闻,情感分析,Reddit,新闻文本,自然语言处理,数据清洗,实体识别 数据概述: 本数据集包含了从Reddit的r/worldnews板块抓取的热门文章文本,时间范围截至2023年。数据集通过PushShift...
    packageimg
  • 印度Flipkart平台10000至20000元价格区间手机数据集-2022年12月

    2025年4月15日   

    印度Flipkart平台10000至20000元价格区间手机数据集-2022年12月 数据来源:互联网公开数据 标签:Flipkart,手机,电商平台,价格区间,数据清洗,数据分析,印度市场 数据概述:...
    packageimg
  • 宝可梦全图鉴第9世代数据集

    2025年4月15日   

    宝可梦全图鉴第9世代数据集 数据来源:互联网公开数据 标签:宝可梦,游戏数据,分类分析,聚类分析,预测建模,数据清洗,特征工程 数据概述:...
    packageimg
  • 缺失值处理数据集

    2025年4月15日   

    缺失值处理数据集 数据来源:互联网公开数据 标签:缺失值,数据清洗,机器学习,数据预处理,数据分析,数据质量 数据概述: 本数据集旨在展示和处理现实世界数据集中常见的缺失值问题。缺失值通常被标识为NULL或NaN值。数据集中包含不同类型的数据特征,并故意引入了不同比例和模式的缺失值,以便用户学习和实践缺失值处理技巧。 数据用途概述:...
    packageimg
  • 德里维里物流商业数据集2021

    2025年4月15日   

    德里维里物流商业数据集2021 数据来源:互联网公开数据 标签:德里维里,物流,商业分析,数据工程,数据清洗,预测模型,商业智能 数据概述: 本数据集包含了德里维里公司在2021财年期间的物流和商业运营相关数据。数据涵盖了德里维里物流基础设施、运营效率、技术能力等多方面的信息,为理解其业务运作提供了全面的数据基础。 数据用途概述:...
    packageimg