-
成人普查收入数据集
成人普查收入数据集 数据来源:互联网公开数据 标签:普查数据,收入预测,人工智能,数据预处理,分类分析,社会经济研究 数据概述: 本数据集源自1994年美国人口普查局数据库,由Ronny Kohavi和Barry... -
-
威斯康星乳腺癌数据集过滤版
威斯康星乳腺癌数据集过滤版 数据来源:互联网公开数据 标签:乳腺癌,医学数据,数据预处理,R语言,癌症研究,健康分析,数据分析 数据概述: 本数据集是根据威斯康星乳腺癌数据集(原始来源:https://www.kaggle.com/datasets/uciml/breast-cancer-wisconsin-... -
StackOverflow7万求职者数据预处理数据集
StackOverflow7万求职者数据预处理数据集 数据来源:互联网公开数据 标签:Stack Overflow,求职者,程序员,职业发展,数据预处理,机器学习,编码经验,薪资,计算机技能 数据概述: 本数据集是对Stack... -
神秘二分类问题数据集1937-2021
神秘二分类问题数据集1937-2021 数据来源:互联网公开数据 标签:二分类,机器学习,数据预处理,特征工程,数据集分析 数据概述: 本数据集包含937条记录,每个记录拥有21个特征。该数据集是对一个已知的公开数据集进行修改后的版本,其中一些列被重复,并且应用了诸如缩放等变换操作。 数据用途概述:... -
-
基于时间窗口的洪水攻击流量捕获数据集
基于时间窗口的洪水攻击流量捕获数据集 数据来源:互联网公开数据 标签:网络攻击,洪水攻击,时间窗口,数据预处理,机器学习,流量分析,DDoS,ICMP,UDP,TCP,HTTP 数据概述: 本数据集基于CTU-13、CIC-DDoS2019和CIC-... -
-
艾姆斯房价回归清理数据集
艾姆斯房价回归清理数据集 数据来源:互联网公开数据 标签:房价预测,回归分析,数据预处理,机器学习模型,特征工程,异常值处理,编码技术 数据概述:... -
ICR-年龄相关疾病识别数据集
ICR-年龄相关疾病识别数据集 数据来源:互联网公开数据 标签:年龄相关疾病,生物标志物,医学研究,数据预处理,特征工程,机器学习,模型构建 数据概述: 本数据集源自ICR(Identifying Age-Related Conditions)竞赛,主办方为InVitro Cell Research,... -
房屋价格预测准备数据集
房屋价格预测准备数据集 数据来源:互联网公开数据 标签:房价预测,机器学习,数据预处理,特征工程,房地产分析,模型训练 数据概述: 本数据集是基于Kaggle上的“House Price Competition Pipeline”项目中的第三阶段(Scenario... -
德语英语翻译数据集255817样本
德语英语翻译数据集255817样本 数据来源:互联网公开数据 标签:德语,英语,翻译,自然语言处理,深度学习,数据预处理,语言模型 数据概述:... -
-
预处理数据集
预处理数据集 数据来源:互联网公开数据 标签:数据预处理,机器学习,Transformer模型,实验设置,模型优化 数据概述: 本数据集包含了经过预处理的数据文件,这些数据已经准备好用于训练和测试Transformer模型。预处理包括数据清洗、特征提取和格式转换等步骤,以确保数据的质量和适用性。 数据用途概述:... -
印度信贷训练数据集1963-2021
印度信贷训练数据集1963-2021 数据来源:互联网公开数据 标签:信贷,印度,贷款分析,机器学习,数据预处理,预测模型,信用评估 数据概述:... -
性别预测通过名字数据集
性别预测通过名字数据集 数据来源:互联网公开数据 标签:性别预测,名字分析,机器学习, TensorFlow, Keras, 数据预处理, 模型评估 数据概述: 本数据集包含一组名字及其对应性别(男性或女性)的训练数据,旨在用于训练机器学习模型,以预测未见过的名字的性别。数据集包含了多种名字以及它们的性别标签,用于构建和评估性别预测模型。... -
纳粹相关言论数据集1960-2023
纳粹相关言论数据集1960-2023 数据来源:互联网公开数据 标签:纳粹言论,Alt-Right, offensive data, 恶意内容, 语言模型, 数据预处理, 滥用检测 数据概述: 本数据集收录了1960年至2023年间与纳粹相关、Alt-... -
泰坦尼克号灾难预测数据集
泰坦尼克号灾难预测数据集 数据来源:互联网公开数据 标签:泰坦尼克号,灾难预测,机器学习,二分类,生存预测,数据预处理,特征工程 数据概述: 泰坦尼克号灾难预测数据集是一个著名的机器学习二分类问题入门数据集,来源于泰坦尼克号乘客名单,提供了船上个体乘客的信息。该数据集的目标是根据乘客的属性预测其生存的可能性。 数据集包含以下特征: -... -
-