-
艾姆斯房屋数据集缺失值处理版
艾姆斯房屋数据集缺失值处理版 数据来源:互联网公开数据 标签:房屋价格预测,艾姆斯,房地产分析,数据清洗,特征工程,统计建模,机器学习 数据概述: 本数据集基于Iowa Ames地区房屋销售的历史数据进行整理和工程改造,旨在为初学者提供一个易于上手的数据集,减少对缺失值处理的顾虑,专注于特征理解和模型应用。原始数据用于Kaggle上的“House... -
印度销售预测任务数据集2018-2020
印度销售预测任务数据集2018-2020 数据来源:互联网公开数据 标签:销售预测,时间序列分析,数据预处理,特征工程,机器学习算法,销售数据,零售业分析 数据概述:... -
皮马印第安人糖尿病预测分析数据集
皮马印第安人糖尿病预测分析数据集 数据来源:互联网公开数据 标签:糖尿病,预测,医疗,机器学习,数据清洗,特征工程,SMOTE,随机森林,SHAP,可解释性AI 数据概述: 本数据集是经过处理的皮马印第安人糖尿病数据集,原始数据来源于Kaggle。数据集经过了多项预处理步骤,包括: 数据清洗(处理异常值,处理缺失值)... -
印度短视频平台用户行为分析与特征工程数据集
印度短视频平台用户行为分析与特征工程数据集 数据来源:互联网公开数据 标签:用户行为,短视频平台,特征工程,数据分析,用户分析,时间序列,机器学习 数据概述: 本数据集收录了印度某短视频平台上用户在5天内的行为数据,涵盖用户观看、点赞、评论和分享等关键行为。数据集还包括用户基本信息、内容类型等特征,为深入分析用户行为模式提供了基础。 数据用途概述:... -
新闻点击诱饵数据集
新闻点击诱饵数据集 数据来源:互联网公开数据 标签:新闻,点击诱饵,在线媒体,自然语言处理,机器学习,特征工程,社交媒体分析 数据概述: 本数据集包含从不同来源收集的新闻标题及其标签,用于训练和检测点击诱饵(clickbait)内容。数据集分为两个部分:train1.csv 和 train2.csv。train1.csv 收集自 Abhijnan... -
-
竞赛中工作与非工作策略数据集
竞赛中工作与非工作策略数据集 数据来源:互联网公开数据 标签:数据科学竞赛,策略分析,特征工程,模型选择,行业分布,竞赛任务,问题类型,目标分析 数据概述:... -
钓鱼网站检测与识别URL数据集2014
钓鱼网站检测与识别URL数据集2014 数据来源:互联网公开数据 标签:钓鱼网站,URL,网络安全,特征工程,二分类,数据挖掘,机器学习 数据概述: 本数据集包含96,018条URL记录,其中48,009条为合法URL,48,009条为钓鱼网站URL。数据集以CSV文件形式存储,包含以下字段: - "domain":每个URL的唯一标识符。 -... -
银行贷款数据集-预处理版本-助力模型构建与评估
银行贷款数据集-预处理版本-助力模型构建与评估 数据来源:互联网公开数据 标签:银行贷款,机器学习,数据预处理,特征工程,模型训练,数据分析 数据概述:... -
-
肺部扫描影像全量训练数据集
肺部扫描影像全量训练数据集 数据来源:互联网公开数据 标签:RSNA,2024,LSSD,医学影像,数据集,元数据,图像处理,编码,特征工程 数据概述: 本数据集是对原始RSNA 2024... -
Piramal黑客马拉松问题类别分类数据集
Piramal黑客马拉松问题类别分类数据集 数据来源:互联网公开数据 标签:黑客马拉松,问题分类,数据处理,数据清洗,特征工程,机器学习,分类分析 数据概述:... -
贝类生长数据集
贝类生长数据集 数据来源:互联网公开数据 标签:贝类,生长,年龄预测,海洋生物学,机器学习,数据集,UCI,特征工程 数据概述: 本数据集来源于UCI机器学习库,包含了贝类的生长数据,主要用于预测贝类的年龄。数据集包括贝类的物理特征,如长度、直径、高度、壳重等,以及贝类的年龄。 数据用途概述:... -
数据分析与清洗实践数据集
数据分析与清洗实践数据集 数据来源:互联网公开数据 标签:数据分析,数据清洗,数据预处理,数据质量,特征工程,数据建模,行业数据,数据实践 数据概述:... -
夏季分析最终项目房屋价格预测数据集
夏季分析最终项目房屋价格预测数据集 数据来源:互联网公开数据 标签:房屋价格预测,房地产分析,特征工程,数据建模,机器学习,房价影响因素 数据概述:... -
恶意软件样本PCA降维特征数据集-2014年10月至2016年12月
恶意软件样本PCA降维特征数据集-2014年10月至2016年12月 数据来源:互联网公开数据 标签:恶意软件,安全分析,PCA,沙箱,网络安全,特征工程,机器学习,恶意代码 数据概述:... -
决策树模型训练时长预测元数据集
决策树模型训练时长预测元数据集 数据来源:互联网公开数据 标签:元学习,决策树,算法配置,模型训练时长,特征工程,预测,机器学习,Sklearn,Meta-Feature 数据概述: 本数据集是一个元数据集,旨在预测在不同算法配置下,使用Scikit-learn(Sklearn)库构建的决策树模型的训练时长。数据集基于pymfe(Python... -
列车时间序列特征数据集
列车时间序列特征数据集 数据来源:互联网公开数据 标签:列车时间序列,特征工程,机器学习,数据处理,LGBM,预测分析 数据概述: 本数据集包含了经过预处理的列车时间序列数据,适用于机器学习模型训练和预测分析。数据集中的特征已经从原始的时间序列数据中提取出来,可以直接用于模型的构建和评估。 数据用途概述:... -
-
印度农村地区无信用评分人群贷款数据集1963-2021
印度农村地区无信用评分人群贷款数据集1963-2021 数据来源:互联网公开数据 标签:农村信贷,信用评分,贷款审批,数据预处理,特征工程,金融分析,信用风险评估 数据概述:...