生态数据挖掘大语言模型评估与基准测试数据集

关注者: 0

资源积分: 30

分类

公开数据

公开数据

授权

没有提供授权

数据集

生态数据挖掘大语言模型评估与基准测试数据集

数据集概述

本数据集包含生态数据挖掘场景下大语言模型（LLM）评估的完整资源，涵盖500篇摘要数据、专家验证的标注及模型输出，辅以可复现评估流程的脚本，支持LLM性能验证、模型探索及跨领域适配。

文件详解

文件名称: CodesAndDatasets.zip
文件格式: ZIP压缩包
包含内容:
数据文件（CSV格式）：500篇摘要数据、各目标字段的专家验证真实标注、3个核心字段与4个额外字段的模型输出结果
脚本文件（Jupyter notebooks格式）：LLMFramework.ipynb（批量API调用）、evaluateAllLLMs.ipynb与evaluateOtherFields.ipynb（F₁分数及成本-时间指标计算）、visualizeResults.ipynb与plotF1ScoreGrouped.ipynb（图表生成）

数据来源

Zenodo

适用场景

自然语言处理研究：评估大语言模型在生态领域数据提取任务中的性能
生态信息学应用：探索LLM驱动的自主生态系统监测数据挖掘方法
基准测试开发：构建生态数据挖掘场景下的LLM性能基准
跨领域适配研究：将LLM数据提取工作流迁移至其他专业领域的可行性验证

数据与资源

16409858.zipZIP
3.26 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	3.26 MiB
最后更新	2025年12月12日
创建于	2025年12月12日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？