数据集概述
本数据集基于SpectroPhon DBM数据集(10.17632/jt22782wjh.1)外推生成,专为机器学习分类任务设计。包含三个不同样本量的版本(200名、186名和164名受试者),提供基于体重和汗液的特征用于四分类模型。数据集还包含用于Gadio GUI界面测试的未见样本数据,总计四个文件。
文件详解
- 完整数据版本
- 文件名称:
200_Sub_(full data).csv
- 文件格式: CSV
- 字段映射介绍: 包含200名受试者的完整数据,字段包括id(编号)、age(年龄)、gender(性别)、initial weight (without water)(初始干重)、initial weight(初始体重)、resting weight 1-3(静息体重1-3)、final weight(最终体重)、percentage weight change without water(干重变化百分比)、percentage weight change(体重变化百分比)、dehydration(脱水状态)。
- 无极端值版本
- 文件名称:
186_Sub_(no extreme).csv
- 文件格式: CSV
- 字段映射介绍: 包含186名受试者的数据,在完整数据基础上剔除了极端值,字段结构与完整数据版本一致。
- 无缺失无极端值版本
- 文件名称:
164_Sub_(no NaN, no extreme).csv
- 文件格式: CSV
- 字段映射介绍: 包含164名受试者的数据,在完整数据基础上剔除了缺失值和极端值,字段结构与完整数据版本一致。
- 界面测试样本
- 文件名称:
Input_for_UI.xlsx
- 文件格式: XLSX
- 字段映射介绍: 包含用于Hugging Face Spaces上Gadio GUI界面测试的未见输入样本数据。
数据来源
SpectroPhon DBM数据集(10.17632/jt22782wjh.1)
适用场景
- 医学脱水状态分类: 利用体重和汗液特征构建机器学习模型,对受试者的脱水状态进行自动分类。
- 特征工程研究: 分析不同数据预处理策略(如剔除极端值、缺失值)对分类模型性能的影响。
- 用户界面测试: 为基于Web的医疗AI工具提供标准化的测试样本,验证模型的实用性和界面友好性。
- 临床决策支持: 开发辅助医疗专业人员快速评估脱水风险的智能工具。