数据集概述
本数据集包含西班牙不同年份大麦(谷物及研磨态)、玉米、小麦(谷物及研磨态)的近红外光谱数据,以及对应的蛋白质和水分参考测量值。采用不同光谱仪采集,版本为第二版,已移除重复样本及蛋白质、水分列中的零值列。
文件详解
该数据集包含多个CSV文件、元数据文件及Python导入脚本,具体说明如下:
- 大麦光谱数据文件:
- Barley_sensAIfood_UnivCordoba_v2.csv: CSV格式,含一百七十八个大麦样本,光谱范围一千一百至二千五百纳米,包含蛋白质和水分数据。
- BarleyGround_sensAIfood_UnivCordoba.csv: CSV格式,含七个研磨大麦样本,光谱范围四百至二千五百纳米,包含蛋白质和水分数据。
- 玉米光谱数据文件:
- Maize_sensAIfood_UnivCordoba_v2.csv: CSV格式,含一百四十一个玉米样本,光谱范围一千一百至二千五百纳米,包含蛋白质和水分数据。
- 小麦光谱数据文件:
- Wheat_sensAIfood_UnivCordoba_v2.csv: CSV格式,含一百四十九个小麦样本,光谱范围一千一百至二千五百纳米,包含蛋白质和水分数据。
- Wheat2_sensAIfood_UnivCordoba.csv: CSV格式,含两个小麦样本,光谱范围四百至二千五百纳米,包含蛋白质和水分数据。
- WheatGround_sensAIfood_UnivCordoba_v2.csv: CSV格式,含十二个研磨小麦样本,光谱范围四百至二千五百纳米,包含蛋白质和水分数据。
- 辅助文件:
- _metadata.xlsx: Excel格式元数据文件。
- 示例Python导入脚本: 用于数据导入的Python代码文件。
数据来源
西班牙科尔多瓦大学(University of Córdoba)
适用场景
- 农业分析: 用于谷物品质快速检测模型构建,如蛋白质、水分含量的近红外光谱预测。
- 光谱技术研究: 比较不同光谱仪(四百至二千五百纳米与一千一百至二千五百纳米)对谷物成分检测的差异。
- 食品科学应用: 开发基于近红外光谱的谷物品质控制工具,优化生产流程。
- 机器学习建模: 作为光谱数据与化学成分关联分析的训练数据集,提升模型精度。