-
螃蟹年龄合成训练数据集
螃蟹年龄合成训练数据集 数据来源:互联网公开数据 标签:螃蟹,年龄预测,合成数据,机器学习,训练集,特征工程,时间序列 数据概述: 本数据集是为 Playground Series Season3 Episode16 的训练任务额外提供的合成数据。数据由“Make Synthetic Crab Age... -
Python生成的模拟用户信息数据集
Python生成的模拟用户信息数据集 数据来源:互联网公开数据 数据来源: 本数据集由 Python 中的 mimesis 模块人工生成,旨在为数据分析教学、建模实验和特征工程训练提供支持。该数据为合成数据,不涉及真实个人或敏感信息,可安全用于研究与教学场景。 数据内容:... -
-
印度房屋价格分析与预测数据集
印度房屋价格分析与预测数据集 数据来源:互联网公开数据 标签:房屋价格,印度,数据分析,预测模型,数据清理,特征工程,统计假设测试 数据概述:... -
手机价格预测数据集-手机参数特征-2024
手机价格预测数据集-手机参数特征-2024 数据来源:互联网公开数据 标签:手机,价格预测,机器学习,特征工程,电池,摄像头,处理器,内存,屏幕,4G,3G,双卡,蓝牙 数据概述: 本数据集包含两个文件:train.csv 和... -
URL垃圾邮件分类数据集
URL垃圾邮件分类数据集 数据来源:互联网公开数据 标签:URL,垃圾邮件,二元分类,机器学习,数据清洗,特征工程,自然语言处理,网络分析 数据概述: 本数据集包含约87.5万个URL,其中三分之一被标记为垃圾邮件URL,其余为非垃圾邮件URL。数据集由The... -
回归问题中的分类数据集
回归问题中的分类数据集 数据来源:互联网公开数据 标签:回归分析,分类数据,数据预处理,机器学习,特征工程 数据概述: 本数据集是一个小型数据集,适用于回归问题,其中大多数列都是分类数据。该数据集旨在帮助用户掌握在回归问题中处理分类数据的技能,提供了进行特征工程和数据预处理的实践基础。 数据用途概述:... -
-
网络诈骗检测与预防特征工程数据集
网络诈骗检测与预防特征工程数据集 数据来源:互联网公开数据 标签:网络诈骗,人工智能,区块链,预检测,特征工程,数据质量,时间序列 数据概述: 本数据集旨在支持网络诈骗检测与预防领域的研究与应用,特别关注于事前(pre-... -
巴西房地产市场分析数据集1963-2021
巴西房地产市场分析数据集1963-2021 数据来源:互联网公开数据 标签:房地产市场,巴西,区域差异,房价,房屋大小,数据分析,预测模型,数据清洗,特征工程,机器学习 数据概述:... -
宠物收容所动物种类与品种预测数据集
宠物收容所动物种类与品种预测数据集 数据来源:互联网公开数据 标签:宠物收养,动物分类,机器学习,预测模型,特征工程,收容所,动物,品种识别 数据概述: 本数据集旨在帮助建立一个机器学习模型,用于预测宠物收容所中动物的种类和品种。... -
房屋价格训练测试数据集
房屋价格训练测试数据集 数据来源:互联网公开数据 标签:房屋价格,机器学习,数据分析,特征工程,预测模型 数据概述: 本数据集是基于Kaggle上“House Prices: Advanced Regression... -
西雅图金县房屋销售数据集
西雅图金县房屋销售数据集 数据来源:互联网公开数据 标签:房地产,西雅图,金县,房屋销售,数据清洗,特征工程,机器学习,回归预测,城市规划 数据概述: 本数据集包含2014年和2015年美国西雅图金县(King... -
-
平衡DDoS攻击数据集
平衡DDoS攻击数据集 数据来源:互联网公开数据 标签:DDoS攻击,网络安全,数据平衡,特征工程,机器学习,网络防御,数据集平衡 数据概述: 本数据集基于Kaggle上的原始DDoS攻击数据集进行处理,包含127122行数据和23个特征(包括标签)。为了平衡数据集,我们对少数类样本进行了过采样处理。标签值定义为0表示良性流量,1表示DDoS攻击。... -
房地产特征工程数据集
房地产特征工程数据集 数据来源:互联网公开数据 标签:房地产,特征工程,数据分析,房价预测,数据清洗,数据可视化 数据概述: 本数据集包含了艾姆斯市所有住宅房屋的详细信息,共计79个解释变量,涵盖房屋的各个方面。数据集旨在帮助研究者识别影响房屋价格谈判的因素,适用于房地产市场分析、特征工程和房价预测等应用场景。 数据用途概述:... -
不均衡风险评估数据集
不均衡风险评估数据集 数据来源:互联网公开数据 标签:风险评估,不均衡数据,特征工程,机器学习,分类预测 数据概述: 本数据集包含用于确定风险目标(1=高风险, 0=低风险)的不均衡且未经清理的特征集。数据集共有34个特征、1个目标变量和1个标识符列。特征包括整数、浮点数和类别数据等多种类型,适用于风险预测和分类模型的训练。 数据用途概述:... -
DSbowl19肺部疾病诊断竞赛特征数据集
DSbowl19肺部疾病诊断竞赛特征数据集 数据来源:互联网公开数据 标签:医疗,疾病诊断,机器学习,特征工程,数据竞赛,肺部疾病,DSbowl19 数据概述: 本数据集包含了为DSbowl19(Data Science Bowl 2019)竞赛构建的特征。 这些特征旨在用于预测肺部疾病,并为参赛者提供用于构建机器学习模型的输入数据。... -
词语难度评估数据集
词语难度评估数据集 数据来源:互联网公开数据 标签:词语难度,语言学,文本简化,深度学习,特征工程,自然语言处理,词频分析,二分类问题 数据概述 本数据集包含40,481条数据记录,主要用于评估词语的难度。数据集的每个实例包含多个特征,包括词语本身、词长、词频、词频的对数变换、平均反应时间(Mean... -
洛斯阿拉莫斯国家实验室VO-CHUN-HA地震预测数据集
洛斯阿拉莫斯国家实验室VO-CHUN-HA地震预测数据集 数据来源:互联网公开数据 标签:地震预测,机器学习,数据竞赛,时间序列,特征工程 数据概述: 本数据集来源于洛斯阿拉莫斯国家实验室举办的VO-CHUN-...