数据集概述
本数据集为《全球结直肠癌和泌尿道癌发病率地理差异与人群暴露于产colibactin大肠杆菌的关联》研究的组成部分,包含13个相关文件,涉及产colibactin大肠杆菌的基因组数据、癌症发病率统计、分析脚本及可视化结果等,用于支撑该研究的数据分析与结果呈现。
文件详解
- 数据文件
data_fig1.tsv(TSV格式):包含国家缩写、结直肠癌/膀胱癌/前列腺癌发病率、ST73/ST95大肠杆菌宏基因组检测率等字段
fig1b_tree_metadata.tsv(TSV格式):包含大肠杆菌基因组组装编号、序列类型(ST)、系统发育群、pks基因状态等字段
toxin_production_genes_in_Nissle1917.tsv(TSV格式):涉及Nissle1917菌株毒素产生基因的相关数据
st73_st95_infant_microbiome_positives.tsv(TSV格式):记录婴儿 microbiome 中ST73/ST95型大肠杆菌阳性情况
cancer figure data.xlsx(XLSX格式):癌症相关图表数据
- 分析脚本与运行文件
plot_fig1_a_c.R(R格式):图1a-c的绘图脚本
run_veryfasttree2.job(JOB格式):VeryFastTree2分析的运行任务文件
- 可视化与结构文件
fig1.svg、fig2.svg(SVG格式):研究相关的可视化图表
fig1b_tree.nwk(NWK格式):系统发育树结构文件
fig1b_tree_sites.aln.gz(GZ格式):序列比对文件
fig1b_microreact_project.microreact(MICROREACT格式):Microreact项目文件
- 压缩文件
infant_microbiome_slurm_scripts.tar.gz(GZ格式):婴儿 microbiome 分析脚本压缩包
数据来源
Lancet Microbe 2024年12月5日发表的研究“Geographical variation in the incidence of colorectal cancer and urinary tract cancer is associated with population exposure to colibactin-producing Escherichia coli”
适用场景
- 癌症流行病学研究:分析结直肠癌、泌尿道癌发病率的地理差异与产colibactin大肠杆菌暴露的关联
- 微生物组与癌症关联分析:探究特定大肠杆菌菌株(如ST73、ST95)在不同人群中的分布及其与癌症风险的关系
- 细菌基因组学研究:基于基因组数据解析产colibactin大肠杆菌的系统发育特征与毒力基因分布
- 公共卫生政策制定:为不同地区癌症防控策略的制定提供微生物暴露相关的科学依据
- 医学数据分析:支撑微生物暴露与癌症发生机制的深入研究与验证