找到1,869个数据集

标签: 模型训练

过滤结果
  • 阿姆哈拉语监督式主题分类语料库

    2026年2月12日 30 162 130

    数据集概述 本数据集为阿姆哈拉语主题分类监督语料库,由埃塞俄比亚记者专业标注,文件名为Supervised_Topic_Classifier_Corpus.xml。数据集包含一份XML格式文件,未划分训练/测试集、数据/标签集或原始/处理集,可用于自然语言处理领域的阿姆哈拉语文本分类研究,需进一步优化完善。 文件详解...
    packageimg
  • LAYA_问答系统训练验证数据集

    2026年2月12日 30 74 37

    数据集概述 本数据集为LAYA问答系统相关数据集,包含训练和验证两类数据文件,文件总数为3个,涵盖JSONL和XLSX两种格式,主要用于问答系统的训练与验证场景,无目录结构,未提供文件内容预览及说明文档。 文件详解 文件1 文件名称:validation.jsonl 文件格式:JSONL...
    packageimg
  • 监督式匹配与实体解析的清洗数据集

    2026年2月12日 30 104 6

    数据集概述 本数据集包含13个已确立的基准数据集和5个新基准数据集,用于评估基于机器学习(ML)和深度学习(DL)的实体匹配算法。数据集涵盖结构化和文本类型,涉及学术、产品、企业等领域的实体对,支持多种匹配算法的测试与比较。 文件详解 压缩文件(Compressed Files)...
    packageimg
  • 基于弱监督的裂缝检测数据集与预训练模型

    2026年2月10日 30 33 2

    数据集概述 本数据集包含弱监督裂缝检测相关的数据集文件和预训练模型文件,数据集涵盖Aigle、Crack Forest Dataset、DeepCrack三个子数据集的不同粗糙度标注,包括人工生成和合成生成的标注;预训练模型为基于Xception65的TensorFlow模型,整体用于弱监督裂缝检测研究。 文件详解 弱监督裂缝检测数据集文件...
    packageimg
  • 格拉茨理工大学能源需求预测数据及源代码

    2026年2月10日 30 180 61

    数据集概述 本数据集包含奥地利格拉茨理工大学因费尔德加斯校区混合用途区域的电力需求预测相关数据与源代码。基于天气、时间特征、能源消耗及特殊负荷信息,研究短期和长期能源消耗预测,实现投票回归器组合模型,发现特殊负荷信息对预测至关重要,随机森林模型表现最优。 文件详解 数据与源代码压缩包 文件名称:InffeldEnergy.zip 文件格式:ZIP...
    packageimg
  • 用于功能预测项目的蛋白质结构收集数据集

    2026年2月9日 30 82 55

    数据集概述 本数据集为蛋白质结构功能预测项目的完整数据,包含来自Swiss-Prot的蛋白质序列文件及AlphaFoldDB API的查询结果文件,共2个文件,无目录层级划分,未进行训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:swissprot_dataset_fullheader.fasta 文件格式:FASTA...
    packageimg
  • HEEM_历史情感模型数据集v1_0_0

    2026年2月9日 30 134 52

    数据集概述 本数据集为Historic Embodied Emotions Model(HEEM)的首次发布版本,包含一个压缩文件,无目录结构和数据划分,可用于历史情感相关的模型构建与研究。 文件详解 HEEM-dataset-v1.0.0.zip 文件格式:ZIP...
    packageimg
  • Zenodo扩展版食谱数据提取与推荐指南

    2026年2月9日 30 179 78

    数据集概述 本数据集为扩展食谱数据提取与推荐相关数据,包含一份Excel格式文件,无训练/测试、数据/标签或原始/处理数据的划分,文件类型单一,主要用于食谱相关的数据提取与推荐场景。 文件详解 文件名称:Zenodo.CookbookData.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段信息,文件内容围绕扩展食谱数据提取与推荐主题展开...
    packageimg
  • 骨科个性化医疗治疗适宜性机器学习应用数据

    2026年2月9日 30 86 72

    数据集概述 本数据集为骨科个性化医疗场景下,应用机器学习提升治疗适宜性的相关数据。包含一个数据文件,未进行训练/测试、数据/标签或原始/处理的拆分,主要用于支持骨科治疗方案的个性化优化研究。 文件详解 文件名称:data.xlsx 文件格式:XLSX...
    packageimg
  • Spine_project_脊柱CT数据v1

    2026年2月9日 30 58 38

    数据集概述 本数据集为Spine-project/spine-cs-b3的v1版本,是一个包含脊柱CT医学影像相关内容的压缩包文件,未提供具体描述,整体结构简洁,仅含一个压缩文件。 文件详解 文件名称:Spine-project/spine-cs-b3-v1.zip 文件格式:ZIP...
    packageimg
  • Subj_Based_文本主观性二分类数据集

    2026年2月9日 30 67 5

    数据集概述 本数据集为Subj主观性分类数据集,包含一万份文档,是用于二分类任务的数据集,任务为将文档(即句子)分为主观或客观两类。数据集包含文本内容、分类标签及交叉验证划分文件,可用于自然语言处理领域的主观性分析研究。 文件详解 texts.txt 文件格式:TXT 字段映射介绍:文档集合,每行对应一份文本数据 score.txt 文件格式:TXT...
    packageimg
  • 荷兰传记门户_生物信息_关系抽取_标注数据集

    2026年2月1日 30 193 54

    数据集概述 本数据集为荷兰传记文本的人工标注关系抽取数据集,包含14类生物信息相关关系,如出生时间、居住地、亲属关系等。数据源自荷兰传记门户,包含测试集数据及说明文档,共2个文件,用于自然语言处理领域的关系抽取任务研究。 文件详解 README.md 文件格式:.md...
    packageimg
  • SXS_BBH_0868_双黑洞系统模拟数据集

    2026年2月1日 30 108 19

    数据集概述 本数据集为SXS:BBH:0868双黑洞系统模拟数据,由SpEC代码演化生成,包含引力波应变、黑洞视界等核心物理信息,共36个文件,覆盖不同精度层级(Lev1/Lev2/Lev3)的元数据与科学数据,支持天体物理学中双黑洞并合过程的研究。 文件详解 JSON文件(共18个)...
    packageimg
  • SLEAP_Based_植物运动表型跟踪实验数据

    2026年2月1日 30 95 29

    数据集概述 本数据集为基于SLEAP工具的植物运动跟踪实验数据,包含拟南芥向重力性、向光性,豆类缠绕,向日葵向光性及顶视等植物运动的原始视频,以及对应视频的SLEAP标注文件、用户标注训练帧分析文件和预测标签分析文件,整体打包为压缩文件。 文件详解 压缩文件:SLEAPTrackingData.zip 文件格式:ZIP 包含内容:...
    packageimg
  • IJPR_完工时间估计_柔性作业车间调度实例数据

    2026年2月9日 30 4 1

    数据集概述 本数据集包含论文“Makespan estimation in a flexible job-shop scheduling environment using machine...
    packageimg
  • Privy_Based_PII标注协议轨迹数据集

    2026年2月9日 30 86 82

    数据集概述 本数据集是包含标注的PII数据集,内容为基于OpenAPI规范生成的协议轨迹,涵盖JSON、SQL(PostgreSQL、MySQL)、HTML和XML格式,包含六十多种PII类型。数据集以压缩包形式提供,无目录层级和文件分割。 文件详解 文件名称:privy-dataset.zip 文件格式:ZIP...
    packageimg
  • ALT_Based_亚洲语言树库项目缅甸语树库数据

    2026年1月31日 30 74 18

    数据集概述 本数据集是亚洲语言树库(ALT)项目下的缅甸语树库,包含约2万句从英文维基新闻翻译而来的缅甸语句子,由NICT和UCSY联合开发,遵循CC BY-NC-SA 4.0许可协议,为缅甸语自然语言处理研究提供结构化语料资源。 文件详解 压缩文件 文件名称:my-alt-190530.zip 文件格式:ZIP...
    packageimg
  • forTEXT_Based_文学文本情感分析标签集

    2026年2月9日 30 20 1

    数据集概述 本数据集为适用于文学文本情感元素分析的标签集,基于结构导向的情感研究方法,包含文学人物情感类型分析的基础类别,可作为情感分析的入门工具,帮助研究者识别和分类文学文本中的情感表达,数据集包含1个文件。 文件详解 文件名称:forTEXT_Tagset_Emotionsanalyse.xml 文件格式:XML...
    packageimg
  • 密苏里州龙卷风住宅损毁评估数据_用于ANN模型分析

    2026年2月9日 30 125 96

    数据集概述 本数据集包含用于构建人工神经网络模型的相关数据及MATLAB代码,模型旨在评估密苏里州龙卷风事件中住宅建筑的损坏程度。数据涵盖龙卷风、社会人口统计及建筑结构信息,通过神经网络模型确定极端风事件下建筑的损坏状态,共包含4个文件。 文件详解 模型输入数据文件: 文件名称:model3_inputs.mat 文件格式:.mat...
    packageimg
  • 秘鲁信贷违约预测机器学习研究数据_从危机到算法支持

    2026年1月31日 30 15 13

    数据集概述 本数据集为研究论文《From Crisis to Algorithm: Credit Delinquency Prediction in Peru under Critical External Factors Using Machine...
    packageimg