找到405个数据集

标签: 测试集

过滤结果
  • MiRoR11_P2_Based_主要与报告结局提取标注语料库数据

    2026年1月27日   

    数据集概述 本数据集为MiRoR11-P2项目下的标注语料库,用于主要结局与报告结局的提取任务。包含两个子文件夹,分别存储主要结局和报告结局的标注文本,支持医疗文本中结局信息的结构化提取研究,总含多格式标注文件及交叉验证子数据集。 文件详解 Primary_outcomes子文件夹...
    packageimg
  • MatTen_Based_10276种晶体DFT计算弹性张量数据集

    2026年1月27日   

    数据集概述 本数据集包含10276种晶体的密度泛函理论(DFT)计算弹性张量数据,用于MatTen等变图神经网络模型开发。数据涵盖晶体结构、化学公式、弹性张量及不同晶体系统的相关参数,分为三个JSON文件,支持材料弹性特性研究与模型验证。 文件详解 crystal_elasticity_tensor.json 文件格式:JSON...
    packageimg
  • BBOB2018_Based_优化算法CMAES_APOP变体数据

    2026年1月27日   

    数据集概述 本数据集为BBOB2018赛事相关的CMAES-APOP算法三个变体的实验数据,包含1个压缩文件,无目录层级结构,未划分训练/测试集、数据/标签集或原始/处理数据,文件类型单一为压缩格式。 文件详解 文件名称:dataBBOB2018_Manh.zip 文件格式:ZIP 字段映射介绍:压缩包内包含BBOB2018场景下CMAES-...
    packageimg
  • GLaD4CD_Based_全球滑坡变化检测遥感影像数据集_V2_0

    2026年1月27日   

    数据集概述 本数据集是针对滑坡变化检测的专用遥感数据集,包含174起滑坡事件的元数据.csv文件及带训练、测试集的.zip压缩包。训练集和测试集均提供事件前后的Sentinel-2多光谱影像斑块(13波段),测试集额外包含变化图形式的标签,所有影像及标注均为GeoTIFF格式,用于深度学习变化检测工作流开发。 文件详解 元数据文件...
    packageimg
  • Wikidata_test_physics_Based物理数据测试集

    2026年1月27日   

    数据集概述 本数据集是使用wdumps工具生成的Wikidata RDF测试数据,包含4个文件,涵盖info.json、wdump-155.nt.gz、preview.nt、wdumper-spec.json等。数据集实体数、陈述数、三元组数均为0,主要用于测试Wikidata数据导出工具和流程的有效性。 文件详解 info.json...
    packageimg
  • ClinSpEn_CT_Based_平行英西生物医学术语数据_2022

    2026年1月26日   

    数据集概述 本数据集为ClinSpEn-Clinical Terms子任务的样本、测试及背景数据,方向为西班牙语到英语(ES>EN)翻译。术语源自医学文献和临床记录,聚焦疾病、症状等类别,由专业医疗译者翻译修订,支持生物医学领域机器翻译系统开发与评估。 文件详解...
    packageimg
  • HHD_v0_2_Updated_Based_希伯来字符手写图像数据集

    2026年1月26日   

    数据集概述 本数据集是HHD_v0的更新版本,修正了部分错误标签,包含从手写表格中收集的孤立希伯来字符图像,以及训练集和测试集的划分信息,为希伯来手写字符识别研究提供结构化图像数据。 文件详解 文件名称:hhd_dataset.zip 文件格式:ZIP...
    packageimg
  • Cursive_Character_Based_王羲之草诀歌书法字符数据集

    2026年1月21日   

    数据集概述 本数据集基于王羲之《草诀歌》的图像创建,包含九万九千二百九十六张图像样本,分为三百三十一个类别。数据按训练集、验证集、测试集划分,可用于书法字符识别、模式分析等相关研究。 文件详解 文件总数:3个 文件格式:.zip 文件列表: Training_set.zip:训练集压缩包,包含五万九千五百八十个数据样本...
    packageimg
  • IAM_Graph_Database_化学化合物HIV活性分类数据集

    2026年1月25日   

    数据集概述 本数据集源自AIDS抗病毒筛选数据库的活性化合物,包含两千种化学化合物,部分为非连接结构。这些化合物按HIV活性分为训练集、验证集和测试集,用于支持图模式识别与机器学习模型的训练、参数优化及测试。 文件详解 压缩文件 文件名称:Fingerprint.zip、Letter.zip、AIDS.zip、Protein.zip、COIL-...
    packageimg
  • MSUAppleData_V2_密歇根州立大学果园苹果品种图像数据集

    2026年1月23日   

    数据集概述 本数据集为MSU苹果数据集第二版,包含密歇根州立大学果园拍摄的1246张苹果图像,涵盖Gala和Blondee两个品种,分为934张训练集和312张测试集,所有数据采用COCO目标检测格式组织。 文件详解 文件名称:MSUAppleData.zip 文件格式:ZIP...
    packageimg
  • PAN24_CLEF2024_Based多作者写作风格变化检测数据集

    2026年1月23日   

    数据集概述 本数据集为PAN@CLEF2024共享任务“多作者写作风格分析”的专用数据,包含三种难度(Easy、Medium、Hard)的英文文档,任务为段落级内在风格变化检测。数据集分为训练集、验证集和测试集,训练集和验证集含真实标签,测试集无标签,用于算法开发与评估。 文件详解 文件名称:pan24-multi-author-...
    packageimg
  • WD50K_Based_Wikidata超关系知识图谱数据集_2019

    2026年1月22日   

    数据集概述 本数据集是基于2019年8月Wikidata RDF dump构建的超关系数据集,通过提取FB15K-237实体映射的种子节点及其带限定符的陈述,过滤字面量和低提及实体后划分训练、验证、测试集,再采样得到WD50K_33、WD50K_66、WD50K_100三个变体,分别对应不同比例的超关系事实。 文件详解 文件名称:WD50K.zip...
    packageimg
  • QA_Feedback_Based_语言模型训练细粒度人类反馈奖励数据

    2026年1月22日   

    数据集概述 本数据集为论文“Fine-Grained Human Feedback Gives Better Rewards for Language Model Training”所用的QA-...
    packageimg
  • Social_Media_Mask_Based_口罩检测模型训练数据集

    2026年1月22日   

    数据集概述 本数据集为社交媒体口罩数据集,包含用于训练卷积神经网络以检测图像和视频中口罩的Twitter图像相关信息。因Twitter服务条款限制,未直接提供图像,而是提供推文密钥及下载脚本所需信息。数据集含3个文件,分为训练集和测试集建议文件,支持通过指定脚本下载完整数据。 文件详解 download_dataset.py 文件格式:.py...
    packageimg
  • BAT_Example_Submission_BAT基准平台示例提交数据

    2026年1月22日   

    数据集概述 本数据集是用于BAT基准平台的示例提交数据,包含一个压缩文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理数据,文件类型单一为压缩包。 文件详解 文件名称:f34d8d36dae0670d7a56214ca547a15c.zip 文件格式:.zip...
    packageimg
  • HHD_gender_Handwriting_Gender_Dataset

    2026年1月21日   

    数据集概述 本数据集包含819份手写表单,由不同教育背景和年龄(11岁至60多岁)的志愿者书写,包括希伯来语母语者和非母语者。表单有50种变体,每份平均含62个单词。数据集随机分为训练集(80%)、验证集(10%)和测试集(10%),用于手写图像性别分类研究。 文件详解 文件名称:HHD_gender.zip 文件格式:ZIP...
    packageimg
  • Softcite_Based_科学文献软件提及标注数据集_Version2

    2026年1月21日   

    数据集概述 本数据集为Softcite Dataset Version 2,包含4971篇英文开放获取科学文献的软件提及标注,涵盖生命科学与经济学领域,共约4600万词。标注经多阶段人工标注与冲突协调,新增软件类型细分(环境、组件、隐式)及编程语言标注,是科学文献软件提及分析的金标准语料库。 文件详解 压缩包文件...
    packageimg
  • FlowerDetection_Based_花卉检测数据集_archive

    2026年1月21日   

    数据集概述 本数据集为iPhone XR拍摄的花卉检测数据集,含一百零三张不同距离的花卉图像及标注。数据集包含训练、验证、测试子集,用于深度学习模型训练。所有增强图像及标注存储于压缩包中,提供类映射文件及YOLO格式标注文件。 文件详解 FlowerDetection.zip(压缩包) 文件格式:ZIP 目录结构:...
    packageimg
  • Comparison_Based_专家知识与AI算法测试集分析结果对比数据

    2026年1月21日   

    数据集概述 本数据集为二维表格,记录了测试集中事件的专家评估与AI算法输出结果的对比信息。包含事件编号、类型(工作场所事故或未遂事件)、三位专家的评估分类、事件原因分析,以及AI算法的分类和原因识别结果,用于分析两者在分类和根因分析上的一致性与差异。 文件详解 文件名称:Comparison of the selected test set...
    packageimg
  • DisinfoAppear_Based_在线虚假信息链接分类任务数据集_V1

    2026年1月20日   

    数据集概述 本数据集针对在线虚假信息传播的新型链接分类任务构建,聚焦于事实核查文章中出现的链接,将其按文本语境分为虚假信息出现、支持证据、其他三类。包含训练集、测试集、说明文档及代码文件,可用于虚假信息传播相关的链接分类研究,共5个文件。 文件详解 数据文件 文件名称:GS_train.json、GS_test.json 文件格式:JSON...
    packageimg