数据集概述
本数据集围绕高通量噬菌体受体发现展开,通过转座子插入测序(INSeq)方法,识别噬菌体感染大肠杆菌时结合的宿主受体基因,验证了该方法在已知噬菌体(T6、T2、T4、T7)和新分离噬菌体中的有效性,为噬菌体受体研究提供技术支持与实验数据。
文件详解
- 代码文件(.py格式,共6个):
- inseq_pipeline.py、fastq2inseq.py、alleven.py、process_bowtie_output.py、map_genes_bygene.py、normalize_processed.py:用于INSeq数据分析的Python脚本,涵盖数据处理、映射、归一化等流程
- 映射文件(.txt格式):
- Inseq_mapping_Ecoli_112217.txt、Inseq_mapping_Ecoli_080817.txt、Inseq_mapping_Ecoli_101519.txt:包含测序中使用的条形码等映射信息
- Ecoli_ptt.txt:大肠杆菌基因位置相关文本文件
- 文档与补充文件:
- README.txt:数据集说明文档,包含文章引用及NCBI序列存档信息
- Inseq_computer_workflow.sh:数据分析工作流的Shell脚本
- Supplemental_Data_1.xlsx:补充数据表格
- Supplemental_Data_1.pdf:补充数据文档
适用场景
- 噬菌体-细菌互作研究:分析噬菌体感染宿主时的受体结合机制
- 微生物学技术验证:验证转座子插入测序在高通量受体发现中的应用价值
- 噬菌体进化研究:探索噬菌体对细胞受体利用范围(广谱/窄谱)的进化规律
- 生物信息学方法开发:基于INSeq数据分析流程优化噬菌体受体识别算法