找到596个数据集

标签: 训练数据

过滤结果
  • KWX_Based_arXiv学术文章关键词数据集

    2026年1月31日 30 191 91

    数据集概述 本数据集基于arXiv Dataset构建,核心内容为补充了关键词字段的学术文章数据,包含CSV和JSON两种格式的文件,总计2个文件,可用于学术文献的关键词分析与检索支持。 文件详解 CSV文件 文件名称:data.csv 文件格式:CSV...
    packageimg
  • DRIP_Based_软件需求文档段落需求提取数据集

    2026年1月31日 30 17 15

    数据集概述 本数据集为DRIP项目相关的软件需求文档数据集,包含近五年RE、ICSE、REFSQ、REJ会议及期刊的软件需求文档数据,共4个归档文件,用于从软件需求文档段落中提取单个需求的任务。 文件详解 训练数据文件 文件名称:trainData.gz 文件格式:.gz 字段映射介绍:未提供具体字段信息 标注数据文件 文件名称:annotation...
    packageimg
  • CFL_Based汉字构形特征与手写汉字易读性研究数据

    2026年1月31日 30 16 8

    数据集概述 本数据集围绕汉字构形特征与CFL(中文作为外语)初学者手写汉字易读性的关系展开,包含一份研究数据文件,可用于分析汉字结构特征对初学者手写汉字辨识度的影响。 文件详解 文件名称:Research Data.xlsx 文件格式:XLSX...
    packageimg
  • GAP_Based_BNH高斯近似势能生成数据2022

    2026年1月31日 30 42 40

    数据集概述 本数据集包含基于密度泛函理论(DFT)和分子动力学模拟(AIMD)数据生成的BNH体系高斯近似势能(GAP)相关文件,总计二十八份。数据用于材料科学领域的计算模拟,提供BNH体系的势能函数参数,支持相关物质结构与性质的模拟研究。 文件详解 XML元数据文件 文件名称:gap_2b3bsoap_2000_04.xml 文件格式:XML...
    packageimg
  • PlayNet_Based_手球比赛实时动作分类数据集

    2026年1月31日 30 90 83

    数据集概述 本数据集为手球比赛动作分类数据集,包含通过卡尔曼滤波器估计的球员位置、方向(x、y、vx、vy)及球的位置数据,每条数据关联对应的比赛动作类别(如右攻、左攻、暂停等),支持手球比赛实时动作识别任务。 文件详解 LICENSE 文件格式:无扩展名 内容说明:数据集许可文件,规定数据使用权限...
    packageimg
  • 基于主动学习与解空间方法的碰撞安全性设计验证训练数据集

    2026年1月30日 30 16 5

    数据集概述 本数据集包含用于训练碰撞安全性分类器的验证与训练数据及Python代码,核心围绕主动学习与解空间方法结合的碰撞安全性设计识别研究,为相关分类模型开发提供基础数据支持。 文件详解 文件名称:CrashWorthinessClassifier.zip 文件格式:ZIP...
    packageimg
  • InstructIE_Based_双语指令信息抽取数据集

    2026年1月30日 30 50 27

    数据集概述 本数据集为InstructIE双语指令信息抽取数据集,包含中文和英文两种语言的指令调优数据,覆盖事件、自然科学、建筑结构等多个类别。数据集由9个文件组成,主要文件格式为JSON和MD,适用于信息抽取任务的模型训练与评估。 文件详解 说明文档 文件名称:README_ZH.md、README.md 文件格式:MD...
    packageimg
  • ANN_Based_总碱度估算Matlab模型代码及数据

    2026年1月30日 30 68 12

    数据集概述 本数据集包含用于估算总碱度的人工神经网络(ANN)模型Matlab代码及训练模型的5个航次数据,共7个文件。代码支持模型生成与执行,数据用于构建模型,可辅助研究人员复现和应用该神经网络模型分析水体总碱度。 文件详解 README.txt 文件格式:TXT 字段映射介绍:包含代码使用说明,关联论文《A neural network-based...
    packageimg
  • HAL_基于自然语言的查询源代码_论文配套数据_2011年

    2026年1月30日 30 6 1

    数据集概述 本数据集是论文《Querying Source Code with Natural Language》的配套数据,包含支持自然语言查询源代码方法的原型实现与实验相关文件。原型部分有训练数据、映射数据和单元测试查询;实验部分含实验指导、任务描述、输入项目及日志文件,为复现研究结果提供支持。 文件详解 原型文件 文件名称:training-...
    packageimg
  • CLEF_2024_议会辩论_意识形态与权力识别_训练数据

    2026年1月29日 30 197 46

    数据集概述 本数据集是CLEF 2024“议会辩论意识形态与权力识别”共享任务的训练集,源自ParlaMint语料库4.0版本,包含奥地利、比利时等20余个国家及地区议会的辩论演讲文本,标注有意识形态倾向(左/右)和权力属性(执政联盟/反对党)等信息。 文件详解 文件名称:trainingset-ideology-power.zip 文件格式:ZIP...
    packageimg
  • RootPainter_Demo_Poem实验根窗图像数据集

    2026年1月29日 30 9 4

    数据集概述 本数据集包含100张根窗图像,用于RootPainter演示。图像由VSI-BARTZ MS-190手动超高清根窗相机拍摄,分辨率为2340×2400像素(148像素/毫米)。图像来源于POEM草地实验,该实验通过操纵三种植物功能群(杂草、禾草和豆科植物)的到达顺序开展研究。 文件详解...
    packageimg
  • AttackER_NER_Based_网络攻击归因标注数据集

    2026年1月29日 30 20 12

    数据集概述 本数据集为AttackER网络攻击归因NER数据集,包含8个文件,涵盖JSON格式和spacy格式的训练、测试、验证数据,以及预训练模型压缩包和模型运行脚本。数据支持使用spaCy或Huggingface transformers框架训练网络攻击归因领域的NER模型,适用于网络安全场景下的实体识别任务。 文件详解 数据文件(JSON格式)...
    packageimg
  • ESA_HERA_DART_行星防御挑战赛模拟光变曲线数据集

    2026年1月29日 0 175 143

    数据集概述 本数据集为“行星防御挑战赛”数据集,受欧洲空间局HERA任务启发,模拟NASA DART任务撞击后Didymos双星小行星系统的光变曲线测量数据。包含三百组撞击前后的光变曲线对,前两百组附β因子、主星J2值、次星轴比a/c等参数,后一百组需预测β因子和a/c,用于研究撞击动量传递与小行星参数关系。 文件详解...
    packageimg
  • RU_Decon_Based_训练数据框架_图像重建_数据集

    2026年1月29日 30 200 31

    数据集概述 本数据集为RU-Decon的训练数据框架,包含球体图像和合成图像两类核心内容。球体图像通过不同参数、在不同采集系统下捕获,整体用于支持RU-Decon模型的训练,共含一个文件。 文件详解 文件名称:RU-Decon dataset demo.zip 文件格式:ZIP 字段映射介绍:压缩包内包含用于训练RU-...
    packageimg
  • op3_soccer_双足机器人敏捷足球技能深度强化学习数据

    2026年1月29日 30 161 121

    数据集概述 本数据集为论文“Learning Agile Soccer Skills for a Bipedal Robot with Deep Reinforcement Learning”的配套数据发布包,包含可复现量化结果的Python笔记本及原始数据,支持双足机器人敏捷足球技能强化学习相关研究的结果验证与分析。 文件详解...
    packageimg
  • DOVE_Based_光声血管造影超分辨率涂鸦血管增强数据集

    2026年1月29日 30 68 19

    数据集概述 本数据集包含500余张人类嘴唇的高分辨率光声图像,用于训练和生成光声图像,支撑DOVE(涂鸦血管增强)方法的研究。图像通过实验室光声设备采集,经精心筛选确保质量与一致性,为超分辨率成像的机器学习模型提供训练基础。 文件详解 文件名称:dataset for DOVE.zip 文件格式:ZIP...
    packageimg
  • HiT_Based_语言模型层级编码训练评估数据集_2024

    2026年1月29日 30 178 84

    数据集概述 本数据集为论文“Language Models as Hierarchy Encoders”提出的Hierarchy Transformer编码器(HiT)提供训练与评估数据,包含多跳推理、混合跳预测及迁移学习场景数据,涉及snomed、schemaorg、foodon等多个本体,共8个压缩文件,支持直接通过Huggingface...
    packageimg
  • NCERT_CBSE_Based_LLM教育聊天机器人训练数据

    2026年1月29日 30 38 8

    数据集概述 本数据集用于训练基于语言模型(LLM)的教育聊天机器人,包含印度国家教育研究与培训委员会(NCERT)官方网站的社会科学学习材料、中央中等教育委员会(CBSE)官方网站的往年模型答案、考试试卷及对应答案密钥。数据集共3个压缩文件,无目录层级,可支持教育领域智能聊天机器人的开发与优化。 文件详解 study material.zip...
    packageimg
  • 一种自适应且可解释的模型架构_用于化学危险性属性的共识预测数据

    2026年1月29日 30 13 11

    数据集概述 本数据集为化学品危险特性共识预测研究相关数据,包含训练、验证及可解释性案例的支持信息,用于辅助自适应可解释建模架构的构建与验证,涉及化学品危险特性预测领域的实验数据。 文件详解 Supporting Information for interpretable case.xlsx 文件格式:XLSX...
    packageimg
  • Dryad_Source_猩红猴花地理范围限制假设测试研究数据

    2026年1月29日 30 68 14

    数据集概述 本数据集围绕猩红猴花(Erythranthe cardinalis)的地理范围限制展开研究,通过构建生态位模型关联物种分布记录与气候变量,结合独立的全域系统调查数据,分析适宜栖息地的可用性与占据率,以验证适应性限制和扩散限制对物种分布边缘的影响机制。 文件详解 README_for_AngertOccMs_Dryad.rtf...
    packageimg