H5N1_Based_病毒废水检测基准数据集

数据集概述

本数据集为病毒检测方法提供基准,将模拟的H5N1流感序列读数与真实废水宏基因组数据结合,模拟新型H5N1毒株在城市废水中可检测水平的场景。包含总读数约七十一万条,其中H5N1读数占比约百分之零点一六,废水读数占比约百分之九十九点八四,可用于评估病毒检测方法的性能。

文件详解

  • 数据文件
  • 文件名称:h5n1_wastewater_demo.fastq.gz
  • 文件格式:GZ
  • 字段映射介绍:包含H5N1模拟序列与真实废水宏基因组数据结合后的测序读数
  • 预期结果文件
  • 文件名称:expected_results.json
  • 文件格式:JSON
  • 字段映射介绍:包含数据集信息、病毒组成、模拟参数等结构化数据
  • 说明文件
  • 文件名称:README.md
  • 文件格式:MD
  • 字段映射介绍:数据集概述、组成、来源、目录结构及创建方法等说明内容

数据来源

Global Urban Virome Project、Influenza A virus (A/chicken/Egypt/N19604C/2021(H9N2))

适用场景

  • 病毒检测方法评估: 作为基准数据集,测试不同方法对低丰度H5N1毒株的检测灵敏度和特异性
  • 废水病毒监测研究: 模拟真实城市废水病毒多样性场景,支持废水病毒监测技术研发
  • 宏基因组数据分析: 用于宏基因组数据处理流程的优化与验证
  • 公共卫生预警系统开发: 为基于废水的传染病预警系统提供测试数据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 41.51 MiB
最后更新 2026年2月1日
创建于 2026年2月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。