癌症数据集
数据来源:互联网公开数据
标签:癌症,肿瘤特征,机器学习,医学分析,诊断,健康数据
数据概述:
本数据集包含了569个样本的癌症肿瘤特征数据,每条记录有31个特征字段。数据集中的前10个字段表示各种肿瘤特征的平均测量值,接下来的10个字段表示这些特征测量值的标准误差,最后10个字段表示每个特征的3个最坏(最大)测量值的平均值。最后一个字段表示肿瘤类型,1代表良性,0代表恶性。
数据用途概述:
该数据集适用于癌症诊断研究、肿瘤特征分析、机器学习模型训练等多种场景。研究人员可以利用这些数据进行肿瘤特征与恶性程度之间的关联分析,帮助提高癌症诊断的准确性。同时,数据集也适用于医疗健康领域的教育和培训,帮助学习者理解肿瘤特征的测量及其与恶性程度的关系。
举例:
半径:表示从肿瘤中心到边缘的距离。较大的半径通常意味着较大的肿瘤,可能更晚期和更危险。这一测量对于确定肿瘤的阶段和潜在恶性和至关重要。
纹理:表示灰度值的标准差(即像素强度)。这些值用于量化肿瘤的纹理。较高的纹理值表示灰度强度变化较大,可能与不规则的细胞结构相关,这可能是恶性的标志。较低的纹理值表示灰度强度变化较小,可能表明细胞表面更光滑均匀,更符合良性细胞的特点。
周长:较大的周长可能意味着更大的、更不规则的肿瘤边界,可能提示恶性。较小的周长可能意味着较小的、更规则的肿瘤边界,可能提示良性。
面积:面积可以提供关于肿瘤生长和阶段的重要见解。较大的面积可能表明较大的肿瘤,可能是更晚期或更具侵略性的。较小的面积可能表明较小的肿瘤,可能是更早期的。
光滑度:表示半径长度的局部变化。较高的光滑度值表示更不规则、更锯齿状的肿瘤边界,可能提示恶性。较低的光滑度值表示更光滑、更规则的肿瘤边界,可能提示良性。
紧致度:(周长² / 面积 - 1.0)。较高的紧致度值表示更不规则、更不紧凑的形状,可能提示恶性。较低的紧致度值表示更规则、更紧凑的形状,可能提示良性。
凹度:表示轮廓凹陷部分的严重程度。较高的凹度值表示肿瘤边界有更多、更明显的向内弯曲,可能提示恶性。较低的凹度值表示边界更平滑、更凸出,可能提示良性。
凹陷点:表示轮廓凹陷部分的数量。较高的凹陷点数量表示肿瘤边界更不规则、更复杂,有更多向内弯曲,可能提示恶性。较低的凹陷点数量表示边界更平滑、更规则,向内弯曲较少,可能提示良性。
对称性:较高的对称性值表明细胞形状更规则、更均匀,更符合良性细胞的特点。较低的对称性值表示细胞形状更不规则、更不对称,可能是恶性的标志。
分形维度:表示肿瘤边界的复杂性。恶性肿瘤通常比良性肿瘤具有更不规则、更复杂的边界。