-
ApacheJIT即时缺陷预测大型数据集
2025年12月18日 30 175 46
数据集概述 本数据集为即时缺陷预测任务提供大规模数据支持,包含4个子集文件,涵盖提交标识符、提交指标等特征及缺陷标记。同时提供数据集构建的Python脚本、环境配置文件和操作说明,适用于模型训练与评估。 文件详解 数据集文件(位于dataset/目录下):...
-
无人机道路数据集
2025年12月14日 30 120 84
数据集概述 本数据集是通过论文《A GIS pipeline for the production of GeoAI datasets from drone imagery》中描述的地理信息系统(GIS)处理流程生成的无人机道路数据,用于深度学习分割模型的训练与评估,核心研究不同缓冲区大小对道路特征提取效果的影响。 文件详解...
-
实时手术工具检测轻量级YOLOv8变体数据集及源代码
2025年12月13日 30 123 21
数据集概述 该数据集包含用于实时手术工具检测的轻量级YOLOv8变体相关数据,涵盖带标注的手术工具图像帧及对应源代码,支持训练与评估,为医疗场景下的实时目标检测研究提供数据基础。 文件详解 文件名称: code.zip 文件格式: ZIP压缩包 内容说明:...
-
多语言历史报纸命名实体识别实体链接与立场检测数据集2021
2025年12月11日 30 148 108
数据集概述 该数据集为多语言历史报纸资源,包含1850-1950年法语、德语、芬兰语和瑞典语的历史报纸材料,涵盖命名实体识别、实体链接及实体立场检测标注,用于开发和评估历史文档的命名实体处理系统。 文件详解 文件名称: NewsEye-GT-NER_EL_StD-v1.zip 文件格式: ZIP压缩包 内容说明:...
-
Webis标题党破解语料库2022
2025年12月9日 30 12 8
数据集概述 该数据集包含从Facebook、Reddit和Twitter爬取的五千条标题党帖子及其对应的破解内容,按训练、验证、测试集划分。破解内容分为短语型、段落型和非连续多文本型三类,曾用于SemEval-2023标题党破解任务。 文件详解 文件名称: webis-clickbait-22.zip 文件格式: ZIP压缩包 内部文件(按预设划分):...
-
TBGA基因疾病关联生物医学关系抽取数据集
2025年12月7日 30 107 62
数据集概述 该数据集为TBGA,是用于基因-疾病关联(GDA)抽取的大规模半自动标注数据集,包含训练、验证、测试集文本文件及关系名称与ID映射的JSON文件,每条记录对应从句子中提取的单个GDA,以JSON对象结构存储相关信息。 文件详解 数据集压缩包: TBGA.zip,ZIP格式,包含TBGA文件夹及内部所有文件 训练集文本文件:...



