生态数据挖掘大语言模型评估与基准测试数据集

数据集概述

本数据集包含生态数据挖掘场景下大语言模型(LLM)评估的完整资源,涵盖500篇摘要数据、专家验证的标注及模型输出,辅以可复现评估流程的脚本,支持LLM性能验证、模型探索及跨领域适配。

文件详解

  • 文件名称: CodesAndDatasets.zip
  • 文件格式: ZIP压缩包
  • 包含内容:
  • 数据文件(CSV格式):500篇摘要数据、各目标字段的专家验证真实标注、3个核心字段与4个额外字段的模型输出结果
  • 脚本文件(Jupyter notebooks格式):LLMFramework.ipynb(批量API调用)、evaluateAllLLMs.ipynb与evaluateOtherFields.ipynb(F₁分数及成本-时间指标计算)、visualizeResults.ipynb与plotF1ScoreGrouped.ipynb(图表生成)

数据来源

Zenodo

适用场景

  • 自然语言处理研究:评估大语言模型在生态领域数据提取任务中的性能
  • 生态信息学应用:探索LLM驱动的自主生态系统监测数据挖掘方法
  • 基准测试开发:构建生态数据挖掘场景下的LLM性能基准
  • 跨领域适配研究:将LLM数据提取工作流迁移至其他专业领域的可行性验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.26 MiB
最后更新 2025年12月12日
创建于 2025年12月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。