数据集概述
本数据集为研究论文的补充信息(SI)初始数据,核心内容是混合指纹在广义读-跨方法中的应用及其对特定体内毒性结果预测性能的影响。包含2个文件,覆盖网格搜索指标数据和排除标准说明,用于支持毒性预测模型的性能分析与方法验证。
文件详解
- 数据文件(TEST_metric_grid_search.csv)
- 文件格式:CSV
- 字段映射介绍:包含mean_fit_time(平均拟合时间)、std_fit_time(拟合时间标准差)、mean_score_time(平均评分时间)、std_score_time(评分时间标准差)、param_hybrid_weights(混合权重参数)、param_metric(指标参数)、params(参数组合)、split0_test_r2至split4_test_r2(5次分割测试R²值)、mean_test_r2(平均测试R²)、std_test_r2(测试R²标准差)等模型性能指标字段。
- 文档文件(TEST_exclusion.docx)
- 文件格式:DOCX
- 内容说明:记录实验的排除标准相关信息。
数据来源
研究论文“An Exploration of the use of Hybrid Fingerprints in Generalized Read-Across and their Impact on Predictive Performance for selected in vivo toxicity outcomes”的补充信息(SI)
适用场景
- 毒性预测模型优化: 利用网格搜索指标数据,分析混合权重参数对模型预测性能的影响,优化广义读-跨方法中的混合指纹策略。
- 机器学习方法验证: 验证混合指纹在体内毒性结果预测任务中的有效性与稳定性。
- 毒性预测性能评估: 通过R²值等指标,评估模型对特定体内毒性结果的预测精度。
- 实验设计参考: 基于排除标准文档,规范类似毒性预测实验的样本筛选流程。