找到1,884个数据集

标签: 模型训练

过滤结果
  • 密苏里州龙卷风住宅损毁评估数据_用于ANN模型分析

    2026年2月9日   

    数据集概述 本数据集包含用于构建人工神经网络模型的相关数据及MATLAB代码,模型旨在评估密苏里州龙卷风事件中住宅建筑的损坏程度。数据涵盖龙卷风、社会人口统计及建筑结构信息,通过神经网络模型确定极端风事件下建筑的损坏状态,共包含4个文件。 文件详解 模型输入数据文件: 文件名称:model3_inputs.mat 文件格式:.mat...
    packageimg
  • 秘鲁信贷违约预测机器学习研究数据_从危机到算法支持

    2026年1月31日   

    数据集概述 本数据集为研究论文《From Crisis to Algorithm: Credit Delinquency Prediction in Peru under Critical External Factors Using Machine...
    packageimg
  • ML_玻璃溶解_机器学习模型_数据选择策略_数据集

    2026年2月9日   

    数据集概述 本数据集为“玻璃溶解机器学习模型数据选择策略”研究提供支持,包含23个文件,涵盖分子动力学轨迹文件、机器学习模型输入数据及Python脚本,用于分析不同数据选择策略对玻璃溶解预测模型的影响。 文件详解 分子动力学轨迹文件...
    packageimg
  • MycoAI_Data_MycoAI模型训练测试数据

    2026年1月31日   

    数据集概述 本数据集为用于MycoAI模型训练与测试的数据,包含1个文件,可通过指定代码加载使用,更多信息可在GitHub上获取。 文件详解 文件名称:data.zip 文件格式:ZIP 字段映射介绍:数据集未检测到命名模式,无训练/测试、数据/标签、原始/处理数据分割,文件类型唯一为压缩文件。 适用场景 MycoAI模型训练与测试:...
    packageimg
  • Tempo_CNN_Based_音乐节奏估计训练数据集

    2026年2月9日   

    数据集概述 本数据集包含用于训练音乐节奏估计CNN模型的全局节奏标注数据,涵盖LMD Tempo、GiantSteps MTG Tempo和EBall三个子数据集,是支持单步音乐节奏估计CNN模型训练的基础数据。数据集以压缩包形式提供,无训练/测试、数据/标签等拆分结构。 文件详解...
    packageimg
  • Kaggle_Source_番茄叶片病害检测图像数据集

    2026年2月9日   

    数据集概述 本数据集包含番茄叶片的病害及健康状态图像,涵盖九种病害类型和一种健康类型,共十个类别。数据来源于Kaggle平台,用于植物病害检测相关的图像识别研究与应用,以单一压缩包形式存储。 文件详解 文件名称:tomato-leaf-diseases-detection.zip 文件格式:ZIP...
    packageimg
  • HamGNN_Si_600K_SLEM论文训练相关数据

    2026年1月30日   

    数据集概述 本数据集包含SLEM论文中HamGNN模型训练相关的Si-600K数据文件,核心为Si-600.zip压缩包,内部graph_data.npz文件的单位为Bohr/Hartree,哈密顿量格式为ABACUS,是材料科学领域机器学习模型训练的专用数据资源。 文件详解 压缩包文件 文件名称:Si-600.zip 文件格式:ZIP...
    packageimg
  • mDDPM_LungCT_Based肺部CT多组织分割影像数据

    2026年2月8日   

    数据集概述 本数据集包含基于mDDPM的肺部CT影像数据,涵盖HU值范围在-1000至1000的原始图像,以及对应骨骼、肺部和软组织的子文件夹分类图像。数据集以压缩包形式提供,共包含两个文件,无目录层级结构,未划分训练/测试、数据/标签或原始/处理数据。 文件详解 压缩文件包 文件名称:1000images.zip、1096images.zip...
    packageimg
  • Vicuna_Based_生物与天然产物端到端关系抽取合成数据集

    2026年2月9日   

    数据集概述 本数据集是用于生物与天然产物之间关系端到端抽取的合成训练/验证数据,基于Vicuna-13b-v1.5模型生成,源自LLaMA 2。数据依托GME-sampler提取的生物界前1000篇LOTUS文献参考构建,包含训练集10405项、验证集547项,遵循相关文章所述协议生成。 文件详解 训练集文件 文件名称:train.json...
    packageimg
  • SherlockBox_RuNeg_Based_俄语否定标注数据

    2026年1月28日   

    数据集概述 本数据集为俄语否定标注数据集,包含阿瑟·柯南·道尔《硬纸盒子》俄语译文的120个含否定句,标注了否定触发词和否定范围。数据由母语者用Prodigy工具标注,以JSON和TXT两种格式呈现,用于自然语言处理中否定分析研究。 文件详解 文件1:RUS.json 文件格式:JSON...
    packageimg
  • ArguAna_Based_酒店评论情感分析标注语料库_V2

    2026年2月8日   

    数据集概述 本数据集为ArguAna TripAdvisor酒店评论情感分析语料库,包含2100条情感得分均衡的酒店评论,均被手动标注为事实或正负观点,同时标注了评论中的酒店相关方面。此外还提供近20万条未标注的酒店评论,适用于科学研究用途。 文件详解 标注语料包(含软件) 文件名称:arguana-tripadvisor-annotated-...
    packageimg
  • Dryad_Based肌肉MRI机器学习诊断工具准确性研究数据

    2026年1月29日   

    数据集概述 本数据集为肌肉营养不良症(MDs)诊断用肌肉MRI机器学习工具准确性研究的数据支持文件,包含976例来自10种不同MDs患者的骨盆及下肢T1加权肌肉MRI的量化数据,用于训练和验证随机森林模型,辅助医学诊断。 文件详解 文件名称:Dryad data.xlsx 文件格式:XLSX...
    packageimg
  • Bugzz_lightyears_语义分割_计算机视觉_数据集

    2026年2月8日   

    数据集概述 本数据集包含真实与机器人玩具昆虫的图像集合,专为小规模语义分割项目设计。每个昆虫从不同角度拍摄六张图像,覆盖其特征细节。数据集通过Label Studio结合SAM模型完成精确分割,适用于语义分割技术研究与机器学习模型评估。 文件详解 文件名称:Bugzz lightyear.zip 文件格式:ZIP...
    packageimg
  • LC_QuAD_2_1_Based_清洗版知识库问答实验数据集

    2026年2月8日   

    数据集概述 本数据集是LC-QuAD 2.0的清洗版本,包含移除异常值和重复问题后的知识库问答数据,提供Wikidata和DBpedia 2018的虚拟SPARQL模板,以及论文使用的训练、开发、测试集,含带与不带复述问题的两个训练集,共四个JSON文件。 文件详解 训练集(无复述问题)...
    packageimg
  • heureCLÉA_Source_项目源文档数据1_0

    2026年2月7日   

    数据集概述 本数据集为heureCLÉA项目的源文档数据,版本为1.0。数据以压缩包形式存储,包含项目相关的源文档内容,未区分训练/测试、数据/标签或原始/处理数据类型,无可用的自述文件或内容预览。 文件详解 文件名称:heureclea/sourcedocuments-1.0.zip 文件格式:ZIP...
    packageimg
  • Complex_Videos_Based_视频压缩包数据

    2026年2月7日   

    数据集概述 本数据集包含一个视频压缩包文件,核心内容为复杂视频数据,未划分训练/测试集、数据/标签集或原始/处理数据,无目录层级结构,文件类型单一,无说明文档或内容预览。 文件详解 文件名称:complex videos.zip 文件格式:ZIP 字段映射介绍:压缩包内包含复杂视频相关数据,具体内容未提供预览,无明确字段信息。 适用场景...
    packageimg
  • evoting_Sentiment_电子投票情感分析数据集

    2026年2月7日   

    数据集概述 本数据集包含电子投票相关的情感数据,涵盖原始、清理后的电子投票数据文件及情感标签文件,共4个文件。数据用于电子投票场景下的文本情感分析,包含不同处理阶段的电子投票文本数据及对应的情感标签,可支持情感分析模型训练与验证。 文件详解 电子投票原始数据文件 文件名称:evotingall.xlsx 文件格式:XLSX...
    packageimg
  • Telugu_Suicide_Based心理健康检测泰卢固语文本数据集

    2026年2月6日   

    数据集概述 本数据集是Kaggle英文自杀检测数据集前5万行的泰卢固语翻译版,使用IndicTrans2翻译模型生成。核心内容为含自杀倾向标注的泰卢固语文本,每条数据包含文本内容及“自杀倾向”或“非自杀倾向”的分类标签,旨在支持泰卢固语心理健康检测相关研究,共包含2个文件。 文件详解 README.md 文件格式:MD...
    packageimg
  • Wikimedia_数学表达式去重列表数据

    2026年2月2日   

    数据集概述 本数据集包含维基媒体所有项目(含维基百科)中使用的全部数学表达式的去重列表。数据以JSON格式存储,键为输入内容的MD5哈希值,值为从维基文本源中提取的数学表达式内容。数据集可用于数学表达式的标准化、知识图谱构建等场景,仅包含一个文件。 文件详解 文件名称:wmf_texvc_inputs.json 文件格式:JSON...
    packageimg
  • harco_gait_运动数据_研究数据集

    2026年2月2日   

    数据集概述 本数据集为harco_gait数据集,包含一个压缩文件,未提供具体内容描述。数据集未划分训练/测试集、数据/标签集或原始/处理数据集,主要用于运动分析相关研究。 文件详解 文件名称:bpm_70.zip 文件格式:ZIP 字段映射介绍:未提供具体字段信息,文件为压缩格式,需解压后查看内容。 适用场景 运动分析研究:...
    packageimg