坦桑尼亚北部山羊与绵羊小反刍兽疫临床特征及检测结果数据集2021-devothanyambo
数据来源:互联网公开数据
标签:小反刍兽疫,PPR,山羊,绵羊,坦桑尼亚,临床特征,检测结果,机器学习,数据合成,CTGAN
数据概述:
本数据集包含坦桑尼亚北部地区6个区(恩戈罗恩戈罗、卡鲁图、隆戈伊多、蒙多利、梅图和塞伦盖蒂)的山羊和绵羊患小反刍兽疫(PPR)的临床特征及检测结果。研究区域因是坦桑尼亚PPR病毒的引入点且以游牧社区为主而被选中。数据集中的村庄是随机选取的,参与研究的农民协助识别并定位羊群。研究人员观察动物的临床症状,并通过现场RT-qPCR快速测试验证疑似病例。PPR专家通过填写Excel表格收集详细症状数据。初始数据集包含161份山羊和绵羊的临床症状样本,其中12份被确诊为PPR阳性。
数据集包括以下特征:
- temp(体温)
- oral_discharge(口腔分泌物)
- diarreah(腹泻状况)
- difficult_breathing(呼吸状况)
- Age(年龄)
- eye_discharge(眼部分泌物)
- oral_nasal_lession(口腔和鼻部伤口)
- animal(动物种类)
- sex(性别)
- result(快速测试结果)
目标特征是result(快速测试结果),旨在预测动物是否疑似感染PPR。
数据集中只有12个样本为PPR阳性,为了平衡数据集并构建机器学习模型,使用了CTGAN(条件生成对抗网络)数据合成技术,将原始的12个阳性样本和12个阴性样本扩展至21167个样本,并通过统计验证确保其与原始数据集的统计特征相似。
数据用途概述:
该数据集适用于小反刍兽疫的机器学习预测模型构建、临床症状分析、疫情监测和防控策略制定等应用场景。研究人员可以利用此数据进行模型训练和验证;兽医和动物健康专家可以使用数据评估PPR风险并优化早期诊断流程;公共卫生机构可依据数据制定针对性的防控措施,保护坦桑尼亚北部的山羊和绵羊免受PPR的侵害。