找到1,617个数据集

标签: 特征工程

过滤结果
  • 艾姆斯房屋数据集缺失值处理版

    2025年4月14日   

    艾姆斯房屋数据集缺失值处理版 数据来源:互联网公开数据 标签:房屋价格预测,艾姆斯,房地产分析,数据清洗,特征工程,统计建模,机器学习 数据概述: 本数据集基于Iowa Ames地区房屋销售的历史数据进行整理和工程改造,旨在为初学者提供一个易于上手的数据集,减少对缺失值处理的顾虑,专注于特征理解和模型应用。原始数据用于Kaggle上的“House...
    packageimg
  • 印度销售预测任务数据集2018-2020

    2025年4月14日   

    印度销售预测任务数据集2018-2020 数据来源:互联网公开数据 标签:销售预测,时间序列分析,数据预处理,特征工程,机器学习算法,销售数据,零售业分析 数据概述:...
    packageimg
  • 皮马印第安人糖尿病预测分析数据集

    2025年4月14日   

    皮马印第安人糖尿病预测分析数据集 数据来源:互联网公开数据 标签:糖尿病,预测,医疗,机器学习,数据清洗,特征工程,SMOTE,随机森林,SHAP,可解释性AI 数据概述: 本数据集是经过处理的皮马印第安人糖尿病数据集,原始数据来源于Kaggle。数据集经过了多项预处理步骤,包括: 数据清洗(处理异常值,处理缺失值)...
    packageimg
  • 印度短视频平台用户行为分析与特征工程数据集

    2025年4月14日   

    印度短视频平台用户行为分析与特征工程数据集 数据来源:互联网公开数据 标签:用户行为,短视频平台,特征工程,数据分析,用户分析,时间序列,机器学习 数据概述: 本数据集收录了印度某短视频平台上用户在5天内的行为数据,涵盖用户观看、点赞、评论和分享等关键行为。数据集还包括用户基本信息、内容类型等特征,为深入分析用户行为模式提供了基础。 数据用途概述:...
    packageimg
  • 新闻点击诱饵数据集

    2025年4月14日   

    新闻点击诱饵数据集 数据来源:互联网公开数据 标签:新闻,点击诱饵,在线媒体,自然语言处理,机器学习,特征工程,社交媒体分析 数据概述: 本数据集包含从不同来源收集的新闻标题及其标签,用于训练和检测点击诱饵(clickbait)内容。数据集分为两个部分:train1.csv 和 train2.csv。train1.csv 收集自 Abhijnan...
    packageimg
  • 水果产量预测数据集

    2025年4月14日   

    水果产量预测数据集 数据来源:互联网公开数据 标签:水果产量,预测模型,特征工程,数据融合,机器学习,模型优化 数据概述:...
    packageimg
  • 竞赛中工作与非工作策略数据集

    2025年4月14日   

    竞赛中工作与非工作策略数据集 数据来源:互联网公开数据 标签:数据科学竞赛,策略分析,特征工程,模型选择,行业分布,竞赛任务,问题类型,目标分析 数据概述:...
    packageimg
  • 钓鱼网站检测与识别URL数据集2014

    2025年4月14日   

    钓鱼网站检测与识别URL数据集2014 数据来源:互联网公开数据 标签:钓鱼网站,URL,网络安全,特征工程,二分类,数据挖掘,机器学习 数据概述: 本数据集包含96,018条URL记录,其中48,009条为合法URL,48,009条为钓鱼网站URL。数据集以CSV文件形式存储,包含以下字段: - "domain":每个URL的唯一标识符。 -...
    packageimg
  • 银行贷款数据集-预处理版本-助力模型构建与评估

    2025年4月14日   

    银行贷款数据集-预处理版本-助力模型构建与评估 数据来源:互联网公开数据 标签:银行贷款,机器学习,数据预处理,特征工程,模型训练,数据分析 数据概述:...
    packageimg
  • 加利福尼亚房价预测数据集

    2025年4月14日   

    加利福尼亚房价预测数据集 数据来源:互联网公开数据 标签:房价预测,加利福尼亚,数据清洗,数据分析,机器学习,回归分析,特征工程 数据概述:...
    packageimg
  • 肺部扫描影像全量训练数据集

    2025年4月14日   

    肺部扫描影像全量训练数据集 数据来源:互联网公开数据 标签:RSNA,2024,LSSD,医学影像,数据集,元数据,图像处理,编码,特征工程 数据概述: 本数据集是对原始RSNA 2024...
    packageimg
  • Piramal黑客马拉松问题类别分类数据集

    2025年4月14日   

    Piramal黑客马拉松问题类别分类数据集 数据来源:互联网公开数据 标签:黑客马拉松,问题分类,数据处理,数据清洗,特征工程,机器学习,分类分析 数据概述:...
    packageimg
  • 贝类生长数据集

    2025年4月14日   

    贝类生长数据集 数据来源:互联网公开数据 标签:贝类,生长,年龄预测,海洋生物学,机器学习,数据集,UCI,特征工程 数据概述: 本数据集来源于UCI机器学习库,包含了贝类的生长数据,主要用于预测贝类的年龄。数据集包括贝类的物理特征,如长度、直径、高度、壳重等,以及贝类的年龄。 数据用途概述:...
    packageimg
  • 数据分析与清洗实践数据集

    2025年4月14日   

    数据分析与清洗实践数据集 数据来源:互联网公开数据 标签:数据分析,数据清洗,数据预处理,数据质量,特征工程,数据建模,行业数据,数据实践 数据概述:...
    packageimg
  • 夏季分析最终项目房屋价格预测数据集

    2025年4月14日   

    夏季分析最终项目房屋价格预测数据集 数据来源:互联网公开数据 标签:房屋价格预测,房地产分析,特征工程,数据建模,机器学习,房价影响因素 数据概述:...
    packageimg
  • 恶意软件样本PCA降维特征数据集-2014年10月至2016年12月

    2025年4月14日   

    恶意软件样本PCA降维特征数据集-2014年10月至2016年12月 数据来源:互联网公开数据 标签:恶意软件,安全分析,PCA,沙箱,网络安全,特征工程,机器学习,恶意代码 数据概述:...
    packageimg
  • 决策树模型训练时长预测元数据集

    2025年4月14日   

    决策树模型训练时长预测元数据集 数据来源:互联网公开数据 标签:元学习,决策树,算法配置,模型训练时长,特征工程,预测,机器学习,Sklearn,Meta-Feature 数据概述: 本数据集是一个元数据集,旨在预测在不同算法配置下,使用Scikit-learn(Sklearn)库构建的决策树模型的训练时长。数据集基于pymfe(Python...
    packageimg
  • 列车时间序列特征数据集

    2025年4月14日   

    列车时间序列特征数据集 数据来源:互联网公开数据 标签:列车时间序列,特征工程,机器学习,数据处理,LGBM,预测分析 数据概述: 本数据集包含了经过预处理的列车时间序列数据,适用于机器学习模型训练和预测分析。数据集中的特征已经从原始的时间序列数据中提取出来,可以直接用于模型的构建和评估。 数据用途概述:...
    packageimg
  • 太空船泰坦尼克号准备数据集

    2025年4月14日   

    太空船泰坦尼克号准备数据集 数据来源:互联网公开数据 标签:太空船,泰坦尼克号,竞赛数据,特征工程,数据预处理,交叉验证,机器学习 数据概述:...
    packageimg
  • 印度农村地区无信用评分人群贷款数据集1963-2021

    2025年4月14日   

    印度农村地区无信用评分人群贷款数据集1963-2021 数据来源:互联网公开数据 标签:农村信贷,信用评分,贷款审批,数据预处理,特征工程,金融分析,信用风险评估 数据概述:...
    packageimg