自动化特征创建数据集

自动化特征创建数据集 数据来源:互联网公开数据
标签:自动化特征生成,机器学习,数据科学,多表格整合,特征工程,AWS云服务,Kaggle竞赛

数据概述:
本数据集由Mangrove的Surface解决方案生成,旨在解决多表格数据科学问题,特别是在AWS云环境中运行的场景。该解决方案能够从多个数据表中快速生成数千个特征,并将多表格数据整合为单一表格,从而实现信息的高度浓缩。本数据集仅包含Surface应用返回的前200个特征,数据内容来源于Kaggle平台的"Home Credit Default Risk"竞赛。

数据用途概述:
该数据集适用于多种场景,包括但不限于特征工程优化、机器学习模型训练、多表格数据整合研究等。数据科学家和机器学习工程师可以利用此数据集探索自动化特征生成的优势,提升模型性能。此外,数据集还可用于竞赛场景,帮助参赛者快速获取高质量特征,提升比赛成绩。研究人员也可通过此数据集研究自动化特征生成技术在实际应用中的效果和潜力。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 193.26 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。