随机森林分类与太阳耀斑数据分析验证数据集

数据集概述

本数据集为研究论文《Random Forest Classification and Solar Flares Data: Analysis and Validation》的配套数据,包含太阳耀斑相关的原始及训练测试数据集、随机森林模型预测结果、评估指标文件,以及数据后处理Python脚本,支持模型复现与分析。

文件详解

  • 数据文件(CSV格式):
  • dataset.csv:完整数据集,包含日期、时间、VLF振幅、X射线辐照度等字段
  • train_dataset.csv:训练数据集
  • test_dataset.csv:测试数据集
  • 预测结果文件(如dataset_output_predictions_100.csv):按树数量命名,包含预测结果及原始特征字段
  • 评估指标文件(HTML格式):
  • 如dataset_evaluation_metrics_results_100.html:按树数量命名,记录模型性能指标
  • 代码文件:
  • post_processing_workflow.py:Python脚本,含注释,用于数据后处理
  • 说明文件:
  • Instructions.txt:数据集及代码仓库使用说明文档

数据来源

  • National Centers for Environmental Information (NCEI)
  • Worldwide archive of low-frequency data and observations (WALDO)

适用场景

  • 太阳活动研究:分析VLF数据与太阳耀斑的关联
  • 机器学习建模:验证随机森林在时间序列分类任务中的性能
  • 空间天气应用:基于VLF与X射线数据构建太阳耀斑预测模型
  • 模型复现研究:重复论文实验流程,验证分析结论
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 893.11 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。