Global_Sewage_3_Based全球污水研究数据集

数据集概述

本数据集为Global Sewage 3相关数据,包含6个文件,无目录层级。文件类型涵盖CSV、XLSX、Parquet、ZIP,其中CSV文件占比50%。数据涉及污水相关的序列计数、聚类信息、抗性基因分析等内容,可用于环境科学领域的污水研究与分析。

文件详解

  • CSV文件(共3个)
  • 文件名称:counts_clusters.csv、panres_counts.csv、tot_counts.csv
  • 字段映射介绍:counts_clusters.csv包含complete_name(完整名称)、genepid(基因ID)、cluster_representative_98(98%聚类代表)、resfinder(抗性基因查找工具标识)、functional_amr(功能性抗菌药物耐药基因)等字段;panres_counts.csv包含refSequence(参考序列)、readCount(读数计数)、fragmentCount(片段计数)、mapScoreSum(映射分数总和)等字段;tot_counts.csv字段未完全展示,推测为总计数相关数据
  • XLSX文件
  • 文件名称:gs3_flankophile_output.xlsx
  • 文件格式:XLSX
  • Parquet文件
  • 文件名称:gs3.parquet
  • 文件格式:Parquet
  • ZIP文件
  • 文件名称:motus_counts.zip
  • 文件格式:ZIP

适用场景

  • 污水微生物抗性基因分析: 利用counts_clusters.csv中的resfinder、functional_amr等字段,研究污水中抗菌药物耐药基因的分布与特征
  • 污水序列计数统计: 通过panres_counts.csv、tot_counts.csv的计数类字段,分析污水中基因序列的数量与覆盖情况
  • 环境污水数据整合研究: 结合多种格式文件的污水相关数据,开展跨类型数据的整合分析
  • 污水聚类信息研究: 基于counts_clusters.csv的聚类代表字段,探索污水中微生物或基因的聚类规律
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 935.99 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。