找到1,617个数据集

标签: 特征工程

过滤结果
  • 网络诈骗检测与预防特征工程数据集

    2025年4月14日   

    网络诈骗检测与预防特征工程数据集 数据来源:互联网公开数据 标签:网络诈骗,人工智能,区块链,预检测,特征工程,数据质量,时间序列 数据概述: 本数据集旨在支持网络诈骗检测与预防领域的研究与应用,特别关注于事前(pre-...
    packageimg
  • 巴西房地产市场分析数据集1963-2021

    2025年4月14日   

    巴西房地产市场分析数据集1963-2021 数据来源:互联网公开数据 标签:房地产市场,巴西,区域差异,房价,房屋大小,数据分析,预测模型,数据清洗,特征工程,机器学习 数据概述:...
    packageimg
  • 宠物收容所动物种类与品种预测数据集

    2025年4月14日   

    宠物收容所动物种类与品种预测数据集 数据来源:互联网公开数据 标签:宠物收养,动物分类,机器学习,预测模型,特征工程,收容所,动物,品种识别 数据概述: 本数据集旨在帮助建立一个机器学习模型,用于预测宠物收容所中动物的种类和品种。...
    packageimg
  • 房屋价格训练测试数据集

    2025年4月14日   

    房屋价格训练测试数据集 数据来源:互联网公开数据 标签:房屋价格,机器学习,数据分析,特征工程,预测模型 数据概述: 本数据集是基于Kaggle上“House Prices: Advanced Regression...
    packageimg
  • 西雅图金县房屋销售数据集

    2025年4月14日   

    西雅图金县房屋销售数据集 数据来源:互联网公开数据 标签:房地产,西雅图,金县,房屋销售,数据清洗,特征工程,机器学习,回归预测,城市规划 数据概述: 本数据集包含2014年和2015年美国西雅图金县(King...
    packageimg
  • 虚构公司员工数据集

    2025年4月14日   

    虚构公司员工数据集 数据来源:互联网公开数据 标签:员工信息,虚构数据,数据清洗,数据预处理,机器学习,特征工程 数据概述:...
    packageimg
  • 平衡DDoS攻击数据集

    2025年4月14日   

    平衡DDoS攻击数据集 数据来源:互联网公开数据 标签:DDoS攻击,网络安全,数据平衡,特征工程,机器学习,网络防御,数据集平衡 数据概述: 本数据集基于Kaggle上的原始DDoS攻击数据集进行处理,包含127122行数据和23个特征(包括标签)。为了平衡数据集,我们对少数类样本进行了过采样处理。标签值定义为0表示良性流量,1表示DDoS攻击。...
    packageimg
  • 房地产特征工程数据集

    2025年4月14日   

    房地产特征工程数据集 数据来源:互联网公开数据 标签:房地产,特征工程,数据分析,房价预测,数据清洗,数据可视化 数据概述: 本数据集包含了艾姆斯市所有住宅房屋的详细信息,共计79个解释变量,涵盖房屋的各个方面。数据集旨在帮助研究者识别影响房屋价格谈判的因素,适用于房地产市场分析、特征工程和房价预测等应用场景。 数据用途概述:...
    packageimg
  • 不均衡风险评估数据集

    2025年4月14日   

    不均衡风险评估数据集 数据来源:互联网公开数据 标签:风险评估,不均衡数据,特征工程,机器学习,分类预测 数据概述: 本数据集包含用于确定风险目标(1=高风险, 0=低风险)的不均衡且未经清理的特征集。数据集共有34个特征、1个目标变量和1个标识符列。特征包括整数、浮点数和类别数据等多种类型,适用于风险预测和分类模型的训练。 数据用途概述:...
    packageimg
  • DSbowl19肺部疾病诊断竞赛特征数据集

    2025年4月14日   

    DSbowl19肺部疾病诊断竞赛特征数据集 数据来源:互联网公开数据 标签:医疗,疾病诊断,机器学习,特征工程,数据竞赛,肺部疾病,DSbowl19 数据概述: 本数据集包含了为DSbowl19(Data Science Bowl 2019)竞赛构建的特征。 这些特征旨在用于预测肺部疾病,并为参赛者提供用于构建机器学习模型的输入数据。...
    packageimg
  • 词语难度评估数据集

    2025年4月14日   

    词语难度评估数据集 数据来源:互联网公开数据 标签:词语难度,语言学,文本简化,深度学习,特征工程,自然语言处理,词频分析,二分类问题 数据概述 本数据集包含40,481条数据记录,主要用于评估词语的难度。数据集的每个实例包含多个特征,包括词语本身、词长、词频、词频的对数变换、平均反应时间(Mean...
    packageimg
  • 洛斯阿拉莫斯国家实验室VO-CHUN-HA地震预测数据集

    2025年4月14日   

    洛斯阿拉莫斯国家实验室VO-CHUN-HA地震预测数据集 数据来源:互联网公开数据 标签:地震预测,机器学习,数据竞赛,时间序列,特征工程 数据概述: 本数据集来源于洛斯阿拉莫斯国家实验室举办的VO-CHUN-...
    packageimg
  • 篮球比赛NCAA2024数据集

    2025年4月14日   

    篮球比赛NCAA2024数据集 数据来源:互联网公开数据 标签:NCAA, 篮球比赛, 预测模型, 机器学习竞赛, 历史数据, 特征工程, 比赛结果 数据概述 本数据集为 NCAA 2024 比赛相关数据,旨在为 Kaggle “March Machine Learning Mania 2024” 竞赛提供支持。数据集包含多个 CSV...
    packageimg
  • 印度房价预测数据集

    2025年4月14日   

    印度房价预测数据集 数据来源:互联网公开数据 标签:房价预测,印度,房地产,机器学习,回归分析,特征工程,随机森林,神经网络,集成学习 数据概述:...
    packageimg
  • 二分类问题数据集

    2025年4月14日   

    二分类问题数据集 数据来源:互联网公开数据 标签:二分类,机器学习,特征工程,监督学习,分类模型,数据预测,数据科学,数据分析 数据概述:...
    packageimg
  • 印度黑五购物节销售数据分析数据集2021

    2025年4月14日   

    印度黑五购物节销售数据分析数据集2021 数据来源:互联网公开数据 标签:黑五购物节,印度,零售业,消费行为,销售分析,特征工程 数据概述:...
    packageimg
  • 艾姆斯房屋价格预测数据集

    2025年4月14日   

    艾姆斯房屋价格预测数据集 数据来源:互联网公开数据 标签:房屋价格,艾姆斯,房价预测,房地产市场,特征工程,数据建模,预测分析 数据概述: 本数据集包含艾姆斯市住宅房屋的详细信息记录,涉及79个特征变量,几乎涵盖了房屋的所有方面,包括位置、面积、建筑风格、配套设施等关键因素。数据集旨在为房价预测提供全面的背景信息,帮助预测每栋房屋的最终售价。...
    packageimg
  • 未来销售预测商品与店铺信息数据集2021

    2025年4月14日   

    未来销售预测商品与店铺信息数据集2021 数据来源:互联网公开数据 标签:销售预测,商品信息,店铺信息,特征工程,数据翻译,市场分析 数据概述: 本数据集来源于Kaggle的“Predict Future...
    packageimg
  • 机器学习基础入门数据集

    2025年4月14日   

    机器学习基础入门数据集 数据来源:互联网公开数据 标签:机器学习,基础入门,监督学习,非监督学习,数据集,模型评估,特征工程,偏差方差权衡 数据概述:...
    packageimg
  • Spotify用户行为数据集

    2025年4月14日   

    Spotify用户行为数据集 数据来源:互联网公开数据 标签:Spotify,音乐推荐,用户行为分析,特征工程,机器学习模型,音乐特征分析,协同过滤,内容推荐 数据概述: 本数据集包含250个匿名Spotify用户的听歌记录,每位用户约有100首歌曲,总数据量为28469行。每首歌曲的特征包括舞动性、愉悦性、音调、能量等,这些特征通过Spotify...
    packageimg