-
珠宝交易分析用钻石价格与品质指标数据集
2025年6月18日 30 18 8
数据概述: 本数据集包含53,940条钻石的价格记录,每条记录包含10个属性,其中1个属性为目标变量,即钻石的价格。这些属性详细描述了每颗钻石的特征,包括: carat(克拉):钻石的重量,是决定钻石价格的关键因素之一。 cut(切工):钻石的切工等级,分为“Fair”(较差)、“Good”(良好)、“Very... -
电信服务订阅用户信息流失预测数据
2025年6月14日 30 15 8
数据集说明: 该数据集包含来自某电信服务提供商的客户信息与服务使用情况数据,主要用于分析客户流失行为。每条记录代表一位客户的基本属性、服务使用情况、账单信息以及其是否流失的标签。 字段定义: gender:客户性别(0=女性,1=男性) seniorcitizen:是否为老年人(0=否,1=是) partner:是否有配偶(0=否,1=是)... -
乳腺癌肿瘤细胞核特征良恶性判别结构化数据集
2025年6月12日 30 25 10
数据简介: 本数据集包含多项基于乳腺肿瘤细胞核特征提取的医学测量值,用于辅助良恶性肿瘤(诊断结果为“B”或“M”)的分类研究。特征来自数字化乳腺细针穿刺活检(FNA)图像,包括肿瘤半径、周长、纹理、平滑度、紧致度等多维指标。该数据集广泛用于医学影像分析、肿瘤分类建模、机器学习训练等应用。 字段说明: id:唯一标识符 diagnosis:诊断结果,M... -
模型训练加州房地产建模训练与测试数据集
2025年5月23日 30 28 4
数据简介: 该数据集包含加利福尼亚州多个区域的住房统计信息,数据源主要用于分析房价与住房相关因素之间的关系。数据被分为训练集和测试集两个部分,适用于机器学习建模、房地产市场分析及城市规划研究等场景。 字段定义: longitude:经度,表示每条记录所对应地块的地理经度 latitude:纬度,表示每条记录所对应地块的地理纬度... -
汽车价格预测机器学习编码与回归示例数据集
2025年5月14日 30 30 7
数据概述: 本数据集是一个真实、完整的数据集,用于汽车价格的预测分析。数据集中不存在缺失值,保证了数据质量,便于后续的分析与建模工作。数据集包含了多种汽车的详细信息,如品牌、型号、配置、技术参数等,以及对应的市场价格。 数据用途概述:... -
NLp专用短信垃圾邮件分类数据集
2025年5月13日 30 24 2
数据概述: 本数据集是一个短信垃圾邮件收集数据集,包含超过10,000条SMS短信消息,并已被标记为“垃圾邮件”(spam)或“非垃圾邮件”(ham)。数据集中的每条短信以文本字符串的形式呈现。 数据包含以下字段: text:表示每条短信的内容。 target:指示每条短信是“垃圾邮件”还是“非垃圾邮件”。 数据用途概述:... -
电信行业客户忠诚度分类数据集
2025年5月9日 30 12 7
数据概述: 本数据集包含电信公司客户的详细信息,可用于客户流失预测分析。数据集涵盖了客户的用户行为、服务使用情况、账户信息等关键特征。数据经过清洗,不包含任何缺失值,确保了数据的完整性和可用性。 数据用途概述:... -
事故模拟分类建模训练泰坦尼克号乘客生存数据集
2025年5月3日 30 18 4
数据概述: 该信息集合整理自 Kaggle 平台的经典竞赛项目“Titanic: Machine Learning from Disaster”,旨在通过历史乘客数据预测其在 1912 年“泰坦尼克号”沉船事故中的生存结果。该数据集常用于入门级二分类建模练习、特征工程探索以及数据预处理方法的教学与实验。主要特征如下:... -
-
预测印度班加罗尔Bengaluru房价的机器学习数据集
2025年4月22日 30 19 2
数据概述: 本数据集旨在用于预测班加罗尔地区的房屋价格,包含了用于构建和评估机器学习模型的各种特征。数据集涵盖了房屋的多种属性,如面积、卧室数量、地理位置、设施等,旨在帮助用户通过数据分析和建模,预测班加罗尔房屋的潜在价格。 数据用途概述:... -
用于机器学习训练的城市房价印度城市班加罗尔房价预测数据集
2025年4月11日 30 30 9
数据来源:互联网公开数据 数据概述: 本数据集包含了班加罗尔地区的房屋价格相关信息,可用于探索性数据分析(EDA)和机器学习模型的构建。数据集中包含了房屋的基本特征,如面积、卧室数量、地理位置等,以及对应的房屋价格。 数据用途概述:... -
统计学习方法资源包
2024年11月9日 60 24 9
本资料包是统计学习方法的完整学习资源,涵盖了基础理论和高级算法。包含《统计学习方法(第二版)》教材和详细的课件资源,帮助您深入理解统计学习方法的核心概念与算法。 包含内容:教材:权威的《统计学习方法(第二版)》教材,涵盖统计学习的全部知识体系。课件:从基础到高级的22个章节课件,逐步讲解机器学习的各种算法与模型...