-
-
数据2021年12月泰坦尼克生存预测五折交叉验证数据集
数据2021年12月泰坦尼克生存预测五折交叉验证数据集 数据来源:互联网公开数据 标签:泰坦尼克号,生存预测,机器学习,交叉验证,数据分析,Kaggle,竞赛数据,特征工程 数据概述:...
-
信贷违约风险预测模型特征统计数据集
信贷违约风险预测模型特征统计数据集 数据来源:互联网公开数据 标签:信贷风险,机器学习,预测模型,特征工程,统计分析,Kaggle,Home Credit,违约预测 数据概述: 本数据集包含了基于Home...
-
机器学习流程数据集
机器学习流程数据集 数据来源:互联网公开数据 标签:机器学习, 数据处理, 特征工程, 模型构建, 模型评估, 数据预处理, 分类, 回归, 异常值处理, 特征选择 数据概述:...
-
盖亚恒星分类数据集
盖亚恒星分类数据集 数据来源:互联网公开数据 标签:恒星分类,盖亚,天文学,光谱分类,特征工程,机器学习,天体物理学 数据概述: 本数据集是盖亚空间望远镜第三次数据发布(Gaia...
-
IMDb电影数据集-基于特征的用户电影评分预测数据集
IMDb电影数据集-基于特征的用户电影评分预测数据集 数据来源:互联网公开数据 标签:电影,IMDb,评分预测,用户偏好,特征工程,电影数据,票房,演员,导演,制片公司 数据概述:...
-
-
哥伦比亚新冠病例数据集
哥伦比亚新冠病例数据集 数据来源:互联网公开数据 标签:哥伦比亚,新冠,疫情分析,公共卫生,病例数据,特征工程,时间序列,流行病学 数据概述: 本数据集收录了截至2023年12月27日哥伦比亚境内所有新冠阳性病例的完整记录,数据集大小为1.18...
-
UNSW-NB15网络流量数据集
UNSW-NB15网络流量数据集 数据来源:互联网公开数据 标签:DDoS攻击,网络流量,网络安全,机器学习,特征工程,威胁检测,攻击分类 数据概述: 本数据集(UNSW-NB15)由澳大利亚网络空间安全中心(ACCS)与全球研究人员合作创建,旨在解决传统数据集无法准确反映现代网络威胁环境的局限性。数据集通过IXIA...
-
S4E2-400特征数据集
S4E2-400特征数据集 数据来源:互联网公开数据 标签:多类别预测,肥胖风险,特征工程,机器学习,数据分析,健康研究,数据科学,竞赛数据 数据概述: 本数据集包含“S4E2...
-
-
布宜诺斯艾利斯大都会区房地产销售数据集
布宜诺斯艾利斯大都会区房地产销售数据集 数据来源:互联网公开数据 标签:房地产,阿根廷,布宜诺斯艾利斯,价格预测,特征工程,数据分析,城市规划 数据概述:...
-
-
智能手机人体活动识别数据集1963-2021
智能手机人体活动识别数据集1963-2021 数据来源:互联网公开数据 标签:人体活动识别,智能手机,传感器数据,机器学习,数据科学,时间序列,特征工程 数据概述:...
-
协同创新大赛参赛队伍分类预测数据集-2024年
协同创新大赛参赛队伍分类预测数据集-2024年 数据来源:互联网公开数据 标签:机器学习,分类,预测,竞赛,特征工程,数据分析 数据概述: 本数据集是为2024年协同创新大赛准备的,用于参赛队伍分类预测。 数据集包含训练集(train.csv)、测试集(test.csv)和样本提交文件(sample_submission.csv)。...
-
软件质量属性预测数据集
软件质量属性预测数据集 数据来源:互联网公开数据 标签:软件质量,质量属性,预测模型,机器学习,软件工程,数据挖掘,特征工程 数据概述: 本数据集包含两个不同软件仓库的类文件信息,每个类的记录中包含了多个质量属性。数据不仅涵盖类级别的质量属性,还包括方法级别和包级别的质量属性。这些数据为研究软件质量属性之间的关系及其预测模型提供了坚实的基础。...
-
AI文本检测数据预处理数据集
AI文本检测数据预处理数据集 数据来源:互联网公开数据 标签:AI文本检测,自然语言处理,文本分类,数据预处理,机器学习,特征工程,文本清洗 数据概述: 本数据集是原始AI文本检测数据集的预处理版本,原始数据来源于Kaggle平台(https://www.kaggle.com/datasets/thedrcat/daigt-v2-train-...
-
宝石价格建模数据集
宝石价格建模数据集 数据来源:互联网公开数据 标签:宝石,价格建模,回归分析,预测模型,机器学习,特征工程,数据竞赛 数据概述: 本数据集源自Kaggle竞赛“Playground Series - Season 3, Episode...
-
中国股市脱敏股票数据集1963-2021
中国股市脱敏股票数据集1963-2021 数据来源:互联网公开数据 标签:中国股市,脱敏数据,股票市场,数据分析,金融研究,模型预测,特征工程 数据概述: 本数据集包含了中国股市的脱敏股票数据,时间范围从1963年至2021年。数据集中,y表示所有股票每日的涨跌幅,共计96个特征,这些特征的具体含义未知。 数据用途概述:...
-
用户活动机器学习数据集
用户活动机器学习数据集 数据来源:互联网公开数据 标签:用户行为,机器学习,KNN算法,分类模型,特征工程,数据分析,预测建模 数据概述: 本数据集记录了用户的活动数据,涵盖用户行为特征、时间戳、设备信息及用户属性等多维度信息。数据集经过清洗和预处理,包含标准化的特征变量,适用于机器学习模型的训练与验证。数据样本分布均衡,能够有效支持分类任务的开展。...



