药物处理下的基因表达差异分析数据集_Drug_Treatment_Gene_Expression_Differential_Analysis
数据来源:互联网公开数据
标签:基因表达, 药物处理, 差异表达, 单细胞测序, 细胞类型, 基因组学, 生物信息学, 机器学习
数据概述:
该数据集包含药物处理后的基因表达差异分析结果,主要用于研究药物对不同细胞类型的基因表达影响。主要特征如下:
时间跨度:数据未明确标注时间范围,通常被视为一次实验或研究的快照。
地理范围:数据未限定地理范围,数据来源于细胞培养实验。
数据维度:数据集包含多个关键维度,包括:
gene:基因名称。
logFC:对数倍数变化,表示基因表达的变化程度。
AveExpr:平均表达水平。
t:t统计量。
P.Value:p值,表示统计显著性。
adj.P.Val:校正后的p值,用于多重比较校正。
B:B统计量。
Rpert:重复实验指标。
sm_name:药物名称。
sm_lincs_id:药物的LINCS ID。
SMILES:药物的SMILES结构式。
dose_uM:药物浓度(微摩尔)。
timepoint_hr:处理时间(小时)。
cell_type:细胞类型。
sign_log10_pval:显著性指标。
is_de:是否差异表达。
is_de_adj:校正后是否差异表达。
数据格式:数据集包含CSV、Parquet和H5AD三种格式。其中,de_df.csv文件以CSV格式提供,记录了差异表达分析的结果,lincs_id_compound_mapping.parquet文件以Parquet格式存储,train_or_control_bulk_by_cell_type_adata.h5ad文件以H5AD格式存储,用于单细胞数据。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于药物基因组学、细胞生物学和生物信息学等领域的研究,如药物作用机制研究、基因功能分析、细胞信号通路分析等。
行业应用:可以为药物研发、靶点发现和个性化医疗提供数据支持,尤其在药物筛选、疗效预测和药物组合优化方面。
决策支持:支持药物研发项目的决策制定,帮助研究人员了解药物对基因表达的影响,并预测药物的潜在疗效。
教育和培训:作为生物信息学、基因组学和药物研发等课程的辅助材料,帮助学生和研究人员深入理解基因表达调控和药物作用机制。
此数据集特别适合用于探索药物处理对基因表达的影响,分析不同细胞类型对药物的响应差异,以及构建预测药物疗效的模型,从而加速药物研发进程。