找到210个数据集

标签: 基准数据集

过滤结果
  • arXiv_2307_02715_Based_MP2绝热连接正则化反自旋标度泛函数据

    2026年1月18日   

    数据集概述 本数据集对应arXiv论文“Regularized and Opposite spin-scaled functionals from Møller-Plesset adiabatic connection -- higher accuracy at lower...
    packageimg
  • Webis_ArgRank_17_Based_英文论证相关性研究基准数据集_2017

    2026年1月18日   

    数据集概述 本数据集是用于研究论证相关性的英文基准数据集,包含32个排名、超过3万个论证单元的真实论证图,以及可复现排名实验的源代码。数据集以压缩包形式提供,无目录层级划分,可支持论证相关性领域的模型训练与评估。 文件详解 文件名称:webis-argrank-17.zip 文件格式:ZIP...
    packageimg
  • ISSTA_24_Based_Kubernetes_Operator_Bugs实证研究数据集

    2026年1月17日   

    数据集概述 本数据集为ISSTA'24会议论文《An Empirical Study on Kubernetes Operator Bugs》的配套数据,包含从36个主流Kubernetes Operator中收集的210个Bug信息,可用于复现论文研究或作为Kubernetes Operator Bug相关研究的基准数据集。 文件详解...
    packageimg
  • SGoaB_Project_Rijksmuseum文化遗产图像目标检测自动标注及人工验证数据

    2026年1月17日   

    数据集概述 本数据集包含荷兰国立博物馆(Rijksmuseum)文化遗产数字对象图像的目标检测标注,分为自动标注和人工验证两个子集,用于评估Saint George on a Bike项目开发的目标检测模型,模型在该数据集上实现约79.4%的精确率和65.7%的召回率。 文件详解 自动目标检测标注文件 文件名称:SgoaB-Rijksmuseum-...
    packageimg
  • N_glycans_Database_人类常见N_聚糖及其m_z值数据_2025

    2026年1月15日   

    数据集概述 本数据集为人类常见N-聚糖数据库,包含不同修饰状态(还原未衍生、游离未衍生、全甲基化、2-AB标记、RapiFluor-MS标记)的N-聚糖及其m/z值信息,支持生物医学领域对N-聚糖结构与质谱特征的研究,仅含一个文件。 文件详解 文件名称:_N-glycans_all_ZP_2025.xlsx 文件格式:XLSX...
    packageimg
  • DEKOIS2_0_for_KarmaDock_虚拟筛选目标蛋白与化合物库数据集

    2026年1月15日   

    数据集概述 本数据集为DEKOIS 2.0版本,用于虚拟筛选任务。针对每个目标,提供蛋白质结构PDB文件、化合物库SMILES文件及Glide对接构象,以压缩包形式存储,支持药物发现领域的虚拟筛选研究。 文件详解 文件名称:DEKOIS2.zip 文件格式:ZIP...
    packageimg
  • Sentiment_Analysis_Based_荷兰语推文自动与人工情感分析对比数据

    2026年1月14日   

    数据集概述 本数据集为Lynette Joosten学士论文所用,包含荷兰语推文的情感分析相关数据,对比了自动与人工情感分析的结果。数据以六个Excel文件呈现,分别对应ING、Rabobank等不同对象的情感分析内容,适用于NLP情感分析方法的效果验证与对比研究。 文件详解 荷兰语推文情感分析文件集(共6个) 文件名称:ING...
    packageimg
  • afids_data_Based_神经影像解剖基准点质量控制与配准数据集_2_0_5版

    2026年1月14日   

    数据集概述 本数据集包含针对常见神经影像模板和数据集的精选解剖基准点标注,用于神经影像的质量控制与配准任务。数据集以压缩包形式提供,未进行训练/测试、数据/标签或原始/处理数据的拆分,仅包含一个归档文件。 文件详解 文件名称:afids-data-2.0.5.zip 文件格式:ZIP...
    packageimg
  • OGRDB_Based_小鼠LEWES_EiJ品系IGKV免疫球蛋白受体种系参考数据集

    2026年1月14日   

    数据集概述 本数据集是发布于Open Germline Receptor Database(OGRDB)的小鼠LEWES/EiJ品系免疫球蛋白κ链可变区(IGKV)受体种系参考集,包含4个文件,涵盖序列数据、元信息及许可文件,为免疫遗传学研究提供标准化的种系受体序列资源。 文件详解 EiJ IGKV_rev_1.json 文件格式:JSON...
    packageimg
  • East_Asian_monsoon_Based_长江三角洲典型地表通量监测基准数据集

    2026年1月14日   

    数据集概述 本数据集是东亚季风区典型区域的基准数据集,包含中国长江三角洲四个站点(两种地表类型:SX农田、DT农田、XZ郊区、DS郊区)的30分钟尺度气象和涡动通量变量数据,覆盖不同时间跨度,总计4个文件。 文件详解 文件名称:SX_cropland.xlsx 文件格式:XLSX...
    packageimg
  • Dzongkha_Handwritten_Digit_Dataset_NLP任务数据集

    2026年1月13日   

    数据集概述 本数据集为宗喀语手写数字图像数据,包含1000张JPG格式图像,涵盖0至9共10类宗喀语数字字符,由不丹100名不同背景人员手写采集,旨在填补宗喀语手写字符识别基准数据集的空白,支持自然语言处理相关研究。 文件详解 文件名称:Dataset.zip 文件格式:ZIP...
    packageimg
  • DBpedia_Conversation_Question_Answering_Dataset

    2026年1月12日   

    数据集概述 本数据集基于DBpedia构建,包含一百一十五个问题及五十组对话内容,用于支持对话式问答相关研究。数据集以单一JSON文件形式存储,未划分训练/测试集、数据/标签集或原始/处理集,可直接用于对话式问答模型的训练或评估。 文件详解 文件名称:context_questions_benchmark.json 文件格式:JSON...
    packageimg
  • CodiEsp_Based_eHealth_CLEF2020西班牙临床案例ICD10编码预测银标准数据

    2026年1月3日   

    数据集概述 本数据集为eHealth CLEF2020任务1参与者提交的西班牙临床案例ICD10(CIE10)编码预测结果银标准,包含各子任务下不同团队的预测数据,采用UTF-8编码的纯文本文件存储,按子任务和团队分类组织,是西班牙临床文本编码任务的参考数据集。 文件详解 文件名称:silver-standard.zip 文件格式:ZIP...
    packageimg
  • JailFact_Bench_LLM越狱攻击与幻觉分析基准数据集_SiMLA2025Workshop

    2026年1月5日   

    数据集概述 本数据集是用于分析大语言模型(LLMs)越狱攻击与幻觉模式的基准数据集,包含语义对齐的越狱及事实性提示词,以及毒性变化、相似度得分、标注策略等元数据,支持LLM安全与事实一致性的评估研究。 文件详解 文件名称:README.md 文件格式:Markdown 字段映射介绍:包含数据集概述、开发背景、使用说明等文档内容...
    packageimg
  • app_reviews_requirements_Based_应用评论需求分析实验数据2024_03_25

    2025年12月31日   

    数据集概述 本数据集围绕应用评论需求分析展开,包含训练集、测试集、基准数据集、实验结果文件、代码文件及提示词文档,共9个文件,覆盖数据、代码、文档三类文件类型,用于应用评论需求分析相关的实验研究。 文件详解 数据文件(.xlsx格式,共5个) test_set_470reviews.xlsx:测试集数据,包含470条应用评论...
    packageimg
  • TD_Tools_Agreement_Evaluation_Based_技术债务测量工具一致性评估实证基准数据

    2025年12月28日   

    数据集概述 本数据集包含来自三个技术债务(TD)测量工具的文件级TD测量数据,是原型分析的输入数据。数据集共包含2个文件,均为.xlsx格式,无目录结构,未划分训练/测试集、数据/标签集或原始/处理数据集,可用于技术债务测量工具的一致性评估研究。 文件详解 文件名称:dataset_java_25.xlsx 文件格式:XLSX...
    packageimg
  • 自主测试代理基准数据集

    2025年12月25日   

    数据集概述 该数据集是针对自主测试代理(Autonomous Tester Agents)的基准测试数据,包含由专业测试人员编写的三个Web应用的一百个测试用例,其中半数为原始用例的变异版本,用于评估代理的bug识别能力,测试用例含需精确断言的多步骤任务。 文件详解 文件名称: ISSTA_ARTEFACT.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 无人机视频数据集

    2025年12月21日   

    数据集概述 本数据集是一个针对现有基准数据集掩盖时间一致性问题的评估数据集,包含十四段由无人机搭载相机拍摄的稳定视频,通过平滑运动突出时间一致性问题,旨在推动稳定视频修复相关研究。 文件详解 文件名称: drone-rgb-dataset_MIMO_ROSO_dewil_et_al_BMVC24.zip 文件格式: ZIP压缩包 文件内容:...
    packageimg
  • 德累斯顿宫廷日记1673年手写文本识别基准数据集

    2025年12月19日   

    数据集概述 本数据集包含1673年《德累斯顿选帝侯约翰·格奥尔格二世宫廷日记》的二十页手写文本基准数据,采用17世纪末萨克森典型楷书体书写,偶见混合字体。提供与原始图像对齐的转录文本及元数据,支持手写文本识别模型训练与评估。 文件详解 该数据集包含三类文件,具体说明如下: - 图像文件(20个): - 文件格式:JPG(.jpg) -...
    packageimg
  • 多模态多时相遥感机器学习基准数据集_MultiSenGE

    2025年12月23日   

    数据集概述 该数据集是覆盖法国东部大型行政区的多模态多时相遥感基准数据集,包含八千一百五十七块二百五十六像素×二百五十六像素的 Sentinel-2 L2A、Sentinel-1 GRD 影像斑块及区域土地利用/覆盖地形数据库,为机器学习应用提供支持。 文件详解 核心数据文件: Sentinel-1 斑块文件:命名格式为...
    packageimg