找到20个数据集

标签: 模型微调

过滤结果
  • Fine_Tuning_Large_Language_Model_安全代码生成大语言模型微调复现数据

    2026年1月5日 30 40 24

    数据集概述 本数据集是论文“Fine Tuning Large Language Model for Secure Code Generation”的复现包,包含大语言模型微调所需的数据集及模型评估结果,用于支持安全代码生成方向的模型训练与性能验证研究,共包含3个文件。 文件详解 README.md 文件格式:MD...
    packageimg
  • Stack_Overflow协作者回答数量代码质量违规与辍学者综合预测分析复现包

    2025年12月22日 30 142 116

    数据集概述 本数据集为Stack Overflow案例研究的复现包,围绕协作者回答数量、代码质量违规及辍学者状态三个任务,对21种算法进行评估,包含数据预处理方法(如归一化、标准化等)及CodeBERT模型微调等研究相关材料。 文件详解 文件名称: Replication Package.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • AUGUSTA语音转文本语言模型训练数据集

    2025年12月22日 30 161 15

    数据集概述 该数据集包含用于微调AUGUSTA语音转文本模型的元数据和精选数据集,AUGUSTA是基于OpenAI Whisper定制的模型,可将南蒂罗尔方言语音转录为标准德语。 文件详解 文件名称: augusta_data-main.zip 文件格式: ZIP压缩包 文件内容:...
    packageimg
  • 孟加拉语AI解决数学奥林匹克问题基准数据集

    2025年12月19日 30 33 22

    数据集概述 该数据集围绕孟加拉语AI解决数学奥林匹克问题基准展开,通过评估大语言模型(LLMs)配置、微调特定数据集及应用检索增强生成(RAG)等方法,提升模型在多语言环境下的推理精度,为数学推理研究提供支持。 文件详解 文件名称:13624ijnlc04.pdf 文件格式:PDF(.pdf)...
    packageimg
  • SportsOpi_争议性体育赛事YouTube评论公众立场数据集

    2025年12月14日 30 161 107

    数据集概述 该数据集为手工整理的YouTube评论集合(约4.3万条),聚焦6起著名争议性体育事件(如腋下击球事件、曼卡德事件等),覆盖约40年历史。通过LLM模型(Llama、Deepseek)进行立场标注(支持、反对、中立),并经微调提升精度,用于公众立场检测研究。 文件详解 标签文件: Frank Lampard Ghost Goal...
    packageimg
  • 基于LLM的编码助手澄清问题设计数据集及模型权重

    2025年12月7日 30 125 106

    数据集概述 本数据集包含用于研究“通过设计激发好奇心:基于LLM的编码助手询问澄清问题”的实验数据与模型权重,涵盖用户研究样本文档、分类器训练数据、测试管道数据、合成数据集及训练后的模型权重文件,为编码助手交互机制研究提供支持。 文件详解 文档文件: Sample of User Study RQ1_ name of...
    packageimg
  • 古诺尔斯语手稿HTR模型训练与测试数据集

    2025年12月6日 30 45 2

    数据集概述 本数据集包含用于古诺尔斯语手稿手写文本识别(HTR)模型的训练与测试数据,支持DH2025论文研究。数据以ZIP压缩包形式存储,分为训练数据和测试数据两个文件夹,包含手稿图像及对应的ALTO-XML标注文件。 文件详解 压缩包文件:bifrost_01.zip(ZIP格式),包含两个子文件夹...
    packageimg
  • Lora微调模型训练数据集与代码框架

    2025年11月27日 30 149 42

    数据集概述 本数据集包含用于Lora微调模型训练的部分数据集及所使用的代码框架,涉及模型训练、测试相关的代码文件与数据文件,为模型微调任务提供数据与代码支持。 文件详解 代码文件(.py格式,共3个): Evalution.py:模型评估相关代码文件 Qwen_max_test.py:Qwen模型测试相关代码文件 Model...
    packageimg
  • 大语言模型微调问答数据集

    2025年10月22日 30 128 83

    大语言模型微调问答数据集_Large_Language_Model_Fine_tuning_Question_Answering_Dataset 数据来源:互联网公开数据 标签:大语言模型, 微调, 问答, 自然语言处理, 文本生成, 模型训练, 迁移学习, 机器学习 数据概述:...
    packageimg
  • 深度学习模型预训练数据集DSBPretrainedModelsDataset-jerrythomas

    2025年5月29日 30 93 88

    深度学习模型预训练数据集DSBPretrainedModelsDataset-jerrythomas 数据来源:互联网公开数据 标签:深度学习,预训练模型,数据集,图像识别,自然语言处理,迁移学习,模型库,人工智能 数据概述: 该数据集包含了预训练的深度学习模型,这些模型在各种数据集上进行了训练,可以用于多种下游任务。主要特征如下:...
    packageimg
  • Gemma模型微调综合编码数据集-malakafaqahmad

    2025年5月29日 30 57 29

    Gemma模型微调综合编码数据集-malakafaqahmad 数据来源:互联网公开数据 标签:编码,数据集,机器学习,自然语言处理,Gemma,模型微调,代码生成,代码理解 数据概述:该数据集包含用于Gemma模型微调的综合编码数据,旨在提升模型在代码生成、代码理解等任务上的表现。主要特征如下:...
    packageimg
  • Gemma2模型微调数据集-anshdarji

    2025年5月29日 30 185 184

    Gemma2模型微调数据集-anshdarji 数据来源:互联网公开数据 标签:大语言模型,微调,数据集,自然语言处理,文本生成,机器学习,人工智能,Gemma 数据概述:该数据集包含了用于微调 Gemma 2 模型的数据,旨在提升模型在特定任务上的表现。主要特征如下: 时间跨度:数据生成时间随数据集内容而异,涵盖不同时间段的文本信息。...
    packageimg
  • 大型语言模型分类微调数据集LLMClassificationFine-tuningDataset-manishkumarpatel13

    2025年5月28日 30 52 26

    大型语言模型分类微调数据集LLMClassificationFine-tuningDataset-manishkumarpatel13 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分类,深度学习,人工智能,语言模型,模型微调 数据概述: 该数据集专注于大型语言模型(Large Language Model,...
    packageimg
  • 大语言模型微调参数数据集Qwen1-5-Llama-Factory-LoRADataset-yuushii

    2025年5月14日 30 68 30

    大语言模型微调参数数据集Qwen1-5-Llama-Factory-LoRADataset-yuushii 数据来源:互联网公开数据 标签:大语言模型,参数微调,数据集,机器学习,深度学习,自然语言处理,人工智能,模型优化 数据概述:...
    packageimg
  • FLAN-T5Large模型微调数据集FLAN-T5LargeFinetunedDataset-shailjakanttiwari

    2025年5月13日 30 89 31

    FLAN-T5Large模型微调数据集FLAN-T5LargeFinetunedDataset-shailjakanttiwari 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,机器翻译,模型微调,大规模语言模型,文本摘要,问答系统 数据概述: 该数据集包含用于微调 FLAN-T5 Large...
    packageimg
  • 低秩适应推理结果数据集LoRAInferenceResultsDataset-anastasiazrkn

    2025年4月26日 30 1 0

    低秩适应推理结果数据集LoRAInferenceResultsDataset-anastasiazrkn 数据来源:互联网公开数据 标签:深度学习,模型微调,LoRA技术,推理性能,人工智能,算法优化,计算机科学,机器学习 数据概述:...
    packageimg
  • 深度学习微调数据集Fine-TuningDataset-inductiveanks

    2025年4月25日 30 175 167

    深度学习微调数据集Fine-TuningDataset-inductiveanks 数据来源:互联网公开数据 标签:深度学习,微调,数据集,机器学习,模型优化,人工智能,算法训练,神经网络 数据概述: 该数据集包含用于深度学习模型微调的数据,适用于模型优化和性能提升。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12

    2025年4月25日 30 205 127

    GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,文本生成,深度学习,人工智能,模型微调 数据概述: 该数据集包含用于微调GPT-2语言模型的数据,主要记录了文本数据及其相关的标注信息。主要特征如下:...
    packageimg
  • 微调研究数据集ResearchonFine-TuningDataset-bonthadasravankumar

    2025年4月25日 30 49 2

    微调研究数据集ResearchonFine-TuningDataset-bonthadasravankumar 数据来源:互联网公开数据 标签:微调研究,数据集,机器学习,深度学习,模型优化,自然语言处理,计算机视觉,人工智能 数据概述:该数据集用于研究微调技术在机器学习和深度学习模型中的应用效果,涵盖了多种任务和数据集的微调结果。主要特征如下:...
    packageimg
  • 现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong

    2025年4月22日 30 11 7

    现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,BERT,模型微调,情感分析,文本分类 数据概述: 该数据集包含用于微调现代BERT模型的数据,主要记录了用于各种自然语言处理任务的文本信息。主要特征如下:...
    packageimg