蛋白质序列突变与pH值关系数据集ProteinSequenceMutationandpHValueDataset-dschettler8845
数据来源:互联网公开数据
标签:蛋白质工程, 蛋白质序列, 突变, pH值, 机器学习, 结构生物学, 生物信息学, 序列分析
数据概述:
该数据集包含来自Novozymes公司的数据,记录了蛋白质序列突变与其pH值之间的关系。主要特征如下:
时间跨度:数据未明确标注时间,可视为静态蛋白质突变与pH值关系的数据。
地理范围:数据来源为Novozymes,未明确具体地理位置,但可能与Novozymes的研究项目相关。
数据维度:数据集包含多个关键字段,如:seq_id(序列ID),mutant_sequence(突变序列),pH(pH值),data_source(数据来源),data_source_enum(数据来源枚举),n_edits(编辑次数),edit_type(编辑类型),edit_idx(编辑索引),wildtype_aa(野生型氨基酸),mutant_aa(突变氨基酸),wildtype_sequence(野生型序列),wildtype_pt_path(野生型蛋白质路径),mutant_pt_path(突变型蛋白质路径)。
数据格式:CSV格式,包含多个CSV文件,方便进行数据分析和建模。
来源信息:数据来源于Novozymes,具体来源信息需进一步核实。已进行数据整理和结构化处理。
该数据集适合用于蛋白质工程、生物信息学和机器学习等领域的研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于蛋白质结构与功能、蛋白质工程、突变对蛋白质稳定性的影响等方面的学术研究,如蛋白质结构预测、突变位点分析等。
行业应用:可以为生物制药、酶工程等行业提供数据支持,尤其是在优化蛋白质稳定性、提高酶活性等方向。
决策支持:支持蛋白质工程领域的研发决策,如筛选理想的突变位点、优化蛋白质设计等。
教育和培训:作为生物信息学、蛋白质工程等相关课程的辅助材料,帮助学生和研究人员深入理解蛋白质结构和功能的关系,以及突变对蛋白质性质的影响。
此数据集特别适合用于探索蛋白质序列突变与pH值之间的关系,以及突变对蛋白质结构和功能的影响,从而帮助用户实现蛋白质优化设计、预测蛋白质行为等目标。