找到823个数据集

标签: 数据预处理

过滤结果
  • 成人普查收入数据集

    2025年4月15日   

    成人普查收入数据集 数据来源:互联网公开数据 标签:普查数据,收入预测,人工智能,数据预处理,分类分析,社会经济研究 数据概述: 本数据集源自1994年美国人口普查局数据库,由Ronny Kohavi和Barry...
    packageimg
  • 脏财务交易数据集

    2025年4月15日   

    脏财务交易数据集 数据来源:互联网公开数据 标签:财务交易,数据清洗,数据预处理,数据质量,缺失值,无效数据,重复数据,异常值 数据概述:...
    packageimg
  • 威斯康星乳腺癌数据集过滤版

    2025年4月15日   

    威斯康星乳腺癌数据集过滤版 数据来源:互联网公开数据 标签:乳腺癌,医学数据,数据预处理,R语言,癌症研究,健康分析,数据分析 数据概述: 本数据集是根据威斯康星乳腺癌数据集(原始来源:https://www.kaggle.com/datasets/uciml/breast-cancer-wisconsin-...
    packageimg
  • StackOverflow7万求职者数据预处理数据集

    2025年4月15日   

    StackOverflow7万求职者数据预处理数据集 数据来源:互联网公开数据 标签:Stack Overflow,求职者,程序员,职业发展,数据预处理,机器学习,编码经验,薪资,计算机技能 数据概述: 本数据集是对Stack...
    packageimg
  • 神秘二分类问题数据集1937-2021

    2025年4月15日   

    神秘二分类问题数据集1937-2021 数据来源:互联网公开数据 标签:二分类,机器学习,数据预处理,特征工程,数据集分析 数据概述: 本数据集包含937条记录,每个记录拥有21个特征。该数据集是对一个已知的公开数据集进行修改后的版本,其中一些列被重复,并且应用了诸如缩放等变换操作。 数据用途概述:...
    packageimg
  • 行业数据集

    2025年4月15日   

    行业数据集 数据来源:互联网公开数据 标签:行业分析,数据预处理,探索性数据分析,随机森林回归,SVM回归,商业趋势,市场预测 数据概述:...
    packageimg
  • 基于时间窗口的洪水攻击流量捕获数据集

    2025年4月15日   

    基于时间窗口的洪水攻击流量捕获数据集 数据来源:互联网公开数据 标签:网络攻击,洪水攻击,时间窗口,数据预处理,机器学习,流量分析,DDoS,ICMP,UDP,TCP,HTTP 数据概述: 本数据集基于CTU-13、CIC-DDoS2019和CIC-...
    packageimg
  • 波士顿房价数据集含相关变量

    2025年4月15日   

    波士顿房价数据集含相关变量 数据来源:互联网公开数据 标签:房价预测,波士顿,房地产,相关性分析,特征工程,数据预处理 数据概述:...
    packageimg
  • 艾姆斯房价回归清理数据集

    2025年4月15日   

    艾姆斯房价回归清理数据集 数据来源:互联网公开数据 标签:房价预测,回归分析,数据预处理,机器学习模型,特征工程,异常值处理,编码技术 数据概述:...
    packageimg
  • ICR-年龄相关疾病识别数据集

    2025年4月15日   

    ICR-年龄相关疾病识别数据集 数据来源:互联网公开数据 标签:年龄相关疾病,生物标志物,医学研究,数据预处理,特征工程,机器学习,模型构建 数据概述: 本数据集源自ICR(Identifying Age-Related Conditions)竞赛,主办方为InVitro Cell Research,...
    packageimg
  • 房屋价格预测准备数据集

    2025年4月15日   

    房屋价格预测准备数据集 数据来源:互联网公开数据 标签:房价预测,机器学习,数据预处理,特征工程,房地产分析,模型训练 数据概述: 本数据集是基于Kaggle上的“House Price Competition Pipeline”项目中的第三阶段(Scenario...
    packageimg
  • 德语英语翻译数据集255817样本

    2025年4月15日   

    德语英语翻译数据集255817样本 数据来源:互联网公开数据 标签:德语,英语,翻译,自然语言处理,深度学习,数据预处理,语言模型 数据概述:...
    packageimg
  • 航班票价数据集

    2025年4月15日   

    航班票价数据集 数据来源:互联网公开数据 标签:航班,机票价格,机器学习,特征工程,数据预处理,航空运输,时间序列,价格预测,数据分析 数据概述:...
    packageimg
  • 预处理数据集

    2025年4月15日   

    预处理数据集 数据来源:互联网公开数据 标签:数据预处理,机器学习,Transformer模型,实验设置,模型优化 数据概述: 本数据集包含了经过预处理的数据文件,这些数据已经准备好用于训练和测试Transformer模型。预处理包括数据清洗、特征提取和格式转换等步骤,以确保数据的质量和适用性。 数据用途概述:...
    packageimg
  • 印度信贷训练数据集1963-2021

    2025年4月15日   

    印度信贷训练数据集1963-2021 数据来源:互联网公开数据 标签:信贷,印度,贷款分析,机器学习,数据预处理,预测模型,信用评估 数据概述:...
    packageimg
  • 性别预测通过名字数据集

    2025年4月15日   

    性别预测通过名字数据集 数据来源:互联网公开数据 标签:性别预测,名字分析,机器学习, TensorFlow, Keras, 数据预处理, 模型评估 数据概述: 本数据集包含一组名字及其对应性别(男性或女性)的训练数据,旨在用于训练机器学习模型,以预测未见过的名字的性别。数据集包含了多种名字以及它们的性别标签,用于构建和评估性别预测模型。...
    packageimg
  • 纳粹相关言论数据集1960-2023

    2025年4月15日   

    纳粹相关言论数据集1960-2023 数据来源:互联网公开数据 标签:纳粹言论,Alt-Right, offensive data, 恶意内容, 语言模型, 数据预处理, 滥用检测 数据概述: 本数据集收录了1960年至2023年间与纳粹相关、Alt-...
    packageimg
  • 泰坦尼克号灾难预测数据集

    2025年4月15日   

    泰坦尼克号灾难预测数据集 数据来源:互联网公开数据 标签:泰坦尼克号,灾难预测,机器学习,二分类,生存预测,数据预处理,特征工程 数据概述: 泰坦尼克号灾难预测数据集是一个著名的机器学习二分类问题入门数据集,来源于泰坦尼克号乘客名单,提供了船上个体乘客的信息。该数据集的目标是根据乘客的属性预测其生存的可能性。 数据集包含以下特征: -...
    packageimg
  • 电影数据集预处理版本

    2025年4月15日   

    电影数据集预处理版本 数据来源:互联网公开数据 标签:电影,数据预处理,用户评分,推荐系统,数据分析,用户行为,电影推荐 数据概述:...
    packageimg
  • 印度贷款预测数据集

    2025年4月15日   

    印度贷款预测数据集 数据来源:互联网公开数据 标签:贷款预测,印度,信用风险,数据分析,机器学习,数据预处理,分类模型 数据概述:...
    packageimg