找到20个数据集

标签: 基线模型

过滤结果
  • LLM4Commit_Based_大语言模型提交信息生成研究复现包数据

    2026年1月23日 30 143 10

    数据集概述 本数据集为论文“Using Large Language Models for Commit Message Generation: A Preliminary Study”的复现包,包含实验评估数据与脚本文件,支持对大语言模型(LLM)生成代码提交信息的研究复现与分析,总文件数为1个。 文件详解 文件名称:LLM4Commit.zip...
    packageimg
  • Sarcasm_Spanish_Based视频对齐西班牙语讽刺标注数据集

    2026年1月21日 30 129 62

    数据集概述 本数据集为西班牙语视频对齐讽刺数据集,基于现有西班牙语讽刺标注数据集优化,将文本按时间顺序排列并与视频对齐,用#标注场景变化。包含视频文件名、每个话语的毫秒级起止位置,文本为手工转录,不含字幕。数据仅用于学术研究,不包含视频文件。 文件详解 文件名称:sarcasmo.xlsx 文件格式:XLSX...
    packageimg
  • Open_Unmix_Based_SDXDB21_Bleeding基线音乐源分离模型训练数据

    2026年1月17日 30 79 51

    数据集概述 本数据集为Open-Unmix Pytorch Bleeding项目的SDXDB21 Bleeding基线模型训练数据,包含训练与验证数据的划分说明、模型训练命令及生成的模型文件。验证集使用指定ID的歌曲,训练通过不同命令针对人声、贝斯、鼓、其他四类音频源分别训练模型,最终生成13个相关文件,用于音乐源分离任务的模型开发与验证。 文件详解...
    packageimg
  • Deliverable_2_2_Based_重点区域生物多样性指标数据库_交付物

    2026年1月15日 30 187 113

    数据集概述 本数据集为交付物2.2,聚焦南美与非洲重点区域,通过栖息地质量、植被结构等变量构建预测模型,生成当前生物多样性模式与基线模型对比数据,识别人类活动导致的物种丰富度、特有性及组成变化。数据分辨率为1平方公里,含22个文件,覆盖物种多样性核心指标。 文件详解 物种丰富度文件 示例名称:Rich_current.tif、Rich_loss.tif...
    packageimg
  • Supervised_Learning_Based_按需合成化学库可扩展监督学习评估数据集_2023

    2026年1月3日 30 116 8

    数据集概述 本数据集为论文《Evaluating scalable supervised learning for synthesize-on-demand chemical...
    packageimg
  • 数据2021年12月3日太阳风超低频振荡驱动总电子含量扰动配套数据集

    2025年12月24日 30 81 29

    数据集概述 本数据集是论文《2021年12月3日太阳风超低频振荡驱动总电子含量扰动》的配套数据,包含GNSS总电子含量(TEC)数据及GITM/WP-GITM模型输出结果,为相关研究提供数据支持。 文件详解 文件名称: README.txt:格式为.txt,包含数据集基本信息,由Xing Meng于2025年5月生成 文件名称:...
    packageimg
  • MTG_Jamendo音乐自动标注数据集

    2025年12月23日 30 6 1

    数据集概述 该数据集是用于音乐自动标注的开放数据集,包含五万五千多首完整音频曲目,覆盖流派、乐器、情绪/主题三类共一百九十五个标签。数据基于Jamendo平台的Creative Commons授权音乐及上传者提供的标签构建,提供详细数据划分及基线模型在不同标签集上的性能报告。 文件详解 文件名称: data.zip 文件格式: ZIP压缩包(.zip)...
    packageimg
  • SemEval_2020任务1无监督词汇语义变化检测后评估数据集

    2025年12月22日 30 75 73

    数据集概述 本数据集为SemEval-2020任务1“无监督词汇语义变化检测”的后评估数据,包含任务起始工具包、测试数据真实值、评分程序、评估阶段结果(含团队排名、提交文件、结果概览及分析图表)等内容,支持该任务相关研究与分析。 文件详解 文件名称:semeval2020_ulscd_posteval.zip 文件格式:ZIP压缩包 压缩包内包含内容:...
    packageimg
  • 欧盟自然利率与货币政策错位数据集

    2025年12月18日 30 190 74

    数据集概述 该数据集围绕欧盟自然利率与货币政策错位主题,包含基线模型和稳健性检验的国家层面数据结果,以及自然利率、实际产出及产出缺口估计值、自然利率预测误差方差分解等核心分析文件,为相关研究提供数据支持。 文件详解 模型结果压缩文件:...
    packageimg
  • Text2KGBench本体驱动文本生成知识图谱基准数据集

    2025年12月13日 30 52 36

    数据集概述 该数据集是用于评估语言模型在本体引导下从文本生成知识图谱能力的基准,包含Wikidata-TekGen(十个本体、一万三千四百七十四句)和DBpedia-WebNLG(十九个本体、四千八百六十句)两个子数据集,遵循本体约束提取文本事实。 文件详解 数据集以压缩包形式提供,内部结构及内容如下: - 压缩包文件:...
    packageimg
  • 犬类健康生命体征数据集

    2025年12月7日 30 38 19

    数据集概述 本数据集包含犬类健康相关的生命体征记录与统计数据,涵盖多轮记录会话中的生理特征信息,以CSV格式呈现每轮会话数据,为犬类健康生理研究提供基础数据支持。 文件详解 文件名称: README.md,文件格式: Markdown (.md),内容: 数据集说明文档,包含数据集描述、CSV文件字段解释等信息。 文件名称:...
    packageimg
  • 新生儿支气管肺发育不良MRI肺气管分割与临床数据集

    2025年12月7日 30 21 13

    数据集概述 该数据集包含40名新生儿的MRI扫描数据及对应的肺和气管语义分割结果,多数新生儿被诊断为支气管肺发育不良(BPD)。数据还包括临床数据和基线分割模型,为新生儿肺部成像研究提供支持。 文件详解 BPD-Neo-data.zip:压缩文件格式,包含40名新生儿的自由呼吸3D stack-of-...
    packageimg
  • 数据2022年2月TPS分类任务软投票基线数据集TPSFeb2022SoftVotingBaselineDataset-dimka11

    2025年5月29日 30 181 135

    2022年2月TPS分类任务软投票基线数据集TPSFeb2022SoftVotingBaselineDataset-dimka11 数据来源:互联网公开数据 标签:分类任务,数据集,机器学习,基线模型,软投票,数据科学,预测分析,竞赛数据 数据概述:该数据集为2022年2月Tabular Playground...
    packageimg
  • 时序预测基线数据集TimeSeriesPredictionBaselineDataset-mirzamilanfarabi

    2025年5月29日 30 155 11

    时序预测基线数据集TimeSeriesPredictionBaselineDataset-mirzamilanfarabi 数据来源:互联网公开数据 标签:时序预测, 机器学习, 气象数据, CatBoost, 数据建模, 基线模型, 预测分析, 数据科学 数据概述:...
    packageimg
  • 自然语言处理问答模型评估数据集NaturalLanguageProcessingQuestionAnsweringModelEvaluation-woosungyoon

    2025年5月1日 30 128 4

    自然语言处理问答模型评估数据集NaturalLanguageProcessingQuestionAnsweringModelEvaluation-woosungyoon 数据来源:互联网公开数据 标签:自然语言处理,问答系统,模型评估,文本生成,机器学习,基线模型,集成学习,链式推理 数据概述:...
    packageimg
  • 表格数据预测任务样本提交数据集TabularDataPredictionTaskSampleSubmissionDataset-shroukali

    2025年4月29日 30 150 115

    表格数据预测任务样本提交数据集TabularDataPredictionTaskSampleSubmissionDataset-shroukali 数据来源:互联网公开数据 标签:表格数据, 预测任务, 机器学习, 样本提交, 数据集, 竞赛, 评估, 基线模型 数据概述:...
    packageimg
  • 训练集预测数据集-写作质量评估基线预测2023-ravi20076

    2025年4月23日 30 27 23

    训练集预测数据集-写作质量评估基线预测2023-ravi20076 数据来源:互联网公开数据 标签:写作质量,预测数据,LGBM,XGB,Catboost,特征工程,数据清理,基线模型 数据概述:...
    packageimg
  • AKIRAXGB基线模型提交数据集AKIRAXGBBaselineModelSubmissionDataset-akiraishii

    2025年4月22日 30 142 9

    AKIRAXGB基线模型提交数据集AKIRAXGBBaselineModelSubmissionDataset-akiraishii 数据来源:互联网公开数据 标签:机器学习,基线模型,数据集,预测分析,回归任务,时间序列,数据科学,模型评估 数据概述: 该数据集包含 AKIRA 项目中 XGB(eXtreme Gradient...
    packageimg
  • LLM基线模型评测数据集-aditya21511

    2025年4月22日 30 109 65

    LLM基线模型评测数据集-aditya21511 数据来源:互联网公开数据 标签:大语言模型,LLM,基线模型,评测,NLP,自然语言处理,基准测试,性能评估 数据概述: 该数据集包含用于评估大语言模型(LLM)性能的基线模型评测数据,用于衡量LLM在不同任务上的表现。主要特征如下: 时间跨度:数据集涵盖了当前LLM发展阶段的多个时间点。...
    packageimg
  • ODS-NLP多分类文本电影评分数据集2024

    2025年4月15日 30 34 25

    ODS-NLP多分类文本电影评分数据集2024 数据来源:互联网公开数据 标签:文本分类,多分类,电影评分,评分预测,NLP,机器学习,基线模型,对数回归,CatBoost,LSTM,Transformer 数据概述: 本数据集来自ODS(Open Data...
    packageimg