高能伽马粒子探测数据集

高能伽马粒子探测数据集

数据来源:互联网公开数据

标签:高能伽马粒子,大气切伦科夫望远镜,模拟数据,机器学习,粒子物理学,信号识别,背景噪声分析

数据概述:
本数据集通过蒙特卡罗(Monte Carlo)模拟生成,用于模拟地面大气切伦科夫伽马望远镜对高能伽马粒子的观测过程。该望远镜利用电磁簇射中产生的带电粒子发出的切伦科夫辐射进行观测,这些辐射会穿过大气层并被探测器记录,从而实现对伽马射线事件的重建。数据集包含了切伦科夫光子在光电倍增管(PMT)阵列中留下的脉冲信息,这些脉冲被排列在二维平面上(称为相机)。根据入射伽马粒子的能量,收集到的切伦科夫光子数量从几百到数万个不等,形成的图像模式可用于统计上区分由原初伽马射线(信号)引起的簇射与由宇宙射线在高层大气中引发的强子簇射(背景)。经过预处理后的簇射图像通常呈现为一个沿某一方向延伸的簇状结构,其长轴方向可指示伽马粒子的方向。通过对图像进行主成分分析(PCA),可以得到一个相关性轴并定义一个椭圆,该椭圆的参数(称为Hillas参数)是用于信号与背景区分的关键特征之一。此外,图像中的簇射分布不对称性、图像平面中的簇射范围以及总沉积能量等特征也被用于区分信号和背景。

该数据集由Corsika蒙特卡罗程序生成,该程序允许观察能量低至50 GeV的事件。数据集中包含19,020个实例,共11个属性,其中包括一个类别标签。以下为属性信息:

  1. x_mean:图像中簇射的质心位置(x坐标)。
  2. y_mean:图像中簇射的质心位置(y坐标)。
  3. length:簇射的主轴长度。
  4. width:簇射的次轴宽度。
  5. skewness:图像分布的偏度。
  6. kurtosis:图像分布的峰度。
  7. conc_x:质心位置相对于主轴的偏移量(x方向)。
  8. conc_y:质心位置相对于主轴的偏移量(y方向)。
  9. f_length:图像的总长度。
  10. f_width:图像的总宽度。
  11. class:类别标签(信号或背景)。

数据用途概述:
该数据集适用于高能物理研究中的信号与背景分类任务,特别是在高能伽马射线天文学领域。研究人员可通过分析数据集中的特征(如Hillas参数、分布偏度、峰度等)来开发和验证用于信号识别的机器学习算法。此外,数据集还可用于: 1. 粒子物理研究:理解高能伽马粒子在大气中的传播与探测机制。 2. 机器学习模型训练:构建和优化信号与背景区分的分类模型。 3. 物理实验仿真:验证和完善模拟生成模型(如Corsika)的准确性。 4. 教育与培训:为学生和研究者提供高能物理和机器学习结合的实践案例。

数据集的生成过程和属性设计使其特别适合用于研究高能伽马射线观测中的信号识别问题,能够为相关领域的科学研究提供重要的数据支持。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.66 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。