数据集概述
本数据集围绕CRISPR-Cas13系统的靶向表达阈值展开,包含研究免疫防御与自身免疫调控的相关代码与数据文件,支持分析靶向表达水平对免疫反应的影响,为理解RNA靶向CRISPR-Cas系统的防御机制提供数据基础。
文件详解
该数据集包含代码文件和数据文件两类,具体说明如下:
- 代码文件(共6个):
- screen_analysis_read_count.py:Python格式,用于筛选分析中的读计数处理
- screen_analysis_differential_abundance.R:R格式,用于筛选分析中的差异丰度计算
- Depletion_ExpressionLevel_comparison.py:Python格式,用于耗竭与表达水平的比较分析
- machine_learning_guide_contribution_MERF.py:Python格式,基于MERF模型的机器学习引导贡献分析
- machine_learning_model_optimization_autosklearn.py:Python格式,使用autosklearn进行机器学习模型优化
- machine_learning_model_interpretation_treeSHAP.py:Python格式,使用treeSHAP进行机器学习模型解释
- 数据文件(共2个):
- targeting-nt_QLFTest.csv:CSV格式,包含guides、type、kegg、logFC、logCPM、F、PValue、FDR等字段,记录靶向nt的QLF测试结果
- gRNAs.csv:CSV格式,包含gene_name、geneid、length、strand、gene_pos、genome_pos、seq等字段,记录gRNA相关信息
适用场景
- CRISPR-Cas系统免疫机制研究:分析靶向表达阈值对免疫防御与自身免疫的调控作用
- 生物信息学数据分析:利用代码文件复现或扩展筛选分析、差异丰度计算等流程
- 机器学习在基因编辑中的应用:基于机器学习模型探究引导RNA对靶向效果的贡献
- 微生物免疫防御研究:理解原核生物RNA靶向CRISPR-Cas系统区分病原体与良性入侵者的机制