高通量噬菌体受体发现数据集

数据集概述

本数据集围绕高通量噬菌体受体发现展开,通过转座子插入测序(INSeq)方法,识别噬菌体感染大肠杆菌时结合的宿主受体基因,验证了该方法在已知噬菌体(T6、T2、T4、T7)和新分离噬菌体中的有效性,为噬菌体受体研究提供技术支持与实验数据。

文件详解

  • 代码文件(.py格式,共6个):
  • inseq_pipeline.py、fastq2inseq.py、alleven.py、process_bowtie_output.py、map_genes_bygene.py、normalize_processed.py:用于INSeq数据分析的Python脚本,涵盖数据处理、映射、归一化等流程
  • 映射文件(.txt格式):
  • Inseq_mapping_Ecoli_112217.txt、Inseq_mapping_Ecoli_080817.txt、Inseq_mapping_Ecoli_101519.txt:包含测序中使用的条形码等映射信息
  • Ecoli_ptt.txt:大肠杆菌基因位置相关文本文件
  • 文档与补充文件:
  • README.txt:数据集说明文档,包含文章引用及NCBI序列存档信息
  • Inseq_computer_workflow.sh:数据分析工作流的Shell脚本
  • Supplemental_Data_1.xlsx:补充数据表格
  • Supplemental_Data_1.pdf:补充数据文档

适用场景

  • 噬菌体-细菌互作研究:分析噬菌体感染宿主时的受体结合机制
  • 微生物学技术验证:验证转座子插入测序在高通量受体发现中的应用价值
  • 噬菌体进化研究:探索噬菌体对细胞受体利用范围(广谱/窄谱)的进化规律
  • 生物信息学方法开发:基于INSeq数据分析流程优化噬菌体受体识别算法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.78 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。