数据集 - 海数据

Fine_Tuning_Large_Language_Model_安全代码生成大语言模型微调复现数据

2026年1月5日 30 40 24

数据集概述本数据集是论文“Fine Tuning Large Language Model for Secure Code Generation”的复现包，包含大语言模型微调所需的数据集及模型评估结果，用于支持安全代码生成方向的模型训练与性能验证研究，共包含3个文件。文件详解 README.md 文件格式：MD...

ZIP

Stack_Overflow协作者回答数量代码质量违规与辍学者综合预测分析复现包

2025年12月22日 30 142 116

数据集概述本数据集为Stack Overflow案例研究的复现包，围绕协作者回答数量、代码质量违规及辍学者状态三个任务，对21种算法进行评估，包含数据预处理方法（如归一化、标准化等）及CodeBERT模型微调等研究相关材料。文件详解文件名称: Replication Package.zip 文件格式: ZIP压缩包内容说明:...

ZIP

AUGUSTA语音转文本语言模型训练数据集

2025年12月22日 30 161 15

数据集概述该数据集包含用于微调AUGUSTA语音转文本模型的元数据和精选数据集，AUGUSTA是基于OpenAI Whisper定制的模型，可将南蒂罗尔方言语音转录为标准德语。文件详解文件名称: augusta_data-main.zip 文件格式: ZIP压缩包文件内容:...

ZIP

孟加拉语AI解决数学奥林匹克问题基准数据集

2025年12月19日 30 33 22

数据集概述该数据集围绕孟加拉语AI解决数学奥林匹克问题基准展开，通过评估大语言模型（LLMs）配置、微调特定数据集及应用检索增强生成（RAG）等方法，提升模型在多语言环境下的推理精度，为数学推理研究提供支持。文件详解文件名称：13624ijnlc04.pdf 文件格式：PDF（.pdf）...

ZIP

SportsOpi_争议性体育赛事YouTube评论公众立场数据集

2025年12月14日 30 161 107

数据集概述该数据集为手工整理的YouTube评论集合（约4.3万条），聚焦6起著名争议性体育事件（如腋下击球事件、曼卡德事件等），覆盖约40年历史。通过LLM模型（Llama、Deepseek）进行立场标注（支持、反对、中立），并经微调提升精度，用于公众立场检测研究。文件详解标签文件: Frank Lampard Ghost Goal...

ZIP

基于LLM的编码助手澄清问题设计数据集及模型权重

2025年12月7日 30 125 106

数据集概述本数据集包含用于研究“通过设计激发好奇心：基于LLM的编码助手询问澄清问题”的实验数据与模型权重，涵盖用户研究样本文档、分类器训练数据、测试管道数据、合成数据集及训练后的模型权重文件，为编码助手交互机制研究提供支持。文件详解文档文件： Sample of User Study RQ1_ name of...

ZIP

古诺尔斯语手稿HTR模型训练与测试数据集

2025年12月6日 30 45 2

数据集概述本数据集包含用于古诺尔斯语手稿手写文本识别（HTR）模型的训练与测试数据，支持DH2025论文研究。数据以ZIP压缩包形式存储，分为训练数据和测试数据两个文件夹，包含手稿图像及对应的ALTO-XML标注文件。文件详解压缩包文件：bifrost_01.zip（ZIP格式），包含两个子文件夹...

ZIP

Lora微调模型训练数据集与代码框架

2025年11月27日 30 149 42

数据集概述本数据集包含用于Lora微调模型训练的部分数据集及所使用的代码框架，涉及模型训练、测试相关的代码文件与数据文件，为模型微调任务提供数据与代码支持。文件详解代码文件（.py格式，共3个）： Evalution.py：模型评估相关代码文件 Qwen_max_test.py：Qwen模型测试相关代码文件 Model...

ZIP

大语言模型微调问答数据集

2025年10月22日 30 128 83

大语言模型微调问答数据集_Large_Language_Model_Fine_tuning_Question_Answering_Dataset 数据来源：互联网公开数据标签：大语言模型, 微调, 问答, 自然语言处理, 文本生成, 模型训练, 迁移学习, 机器学习数据概述：...

ZIP

深度学习模型预训练数据集DSBPretrainedModelsDataset-jerrythomas

2025年5月29日 30 93 88

深度学习模型预训练数据集DSBPretrainedModelsDataset-jerrythomas 数据来源：互联网公开数据标签：深度学习，预训练模型，数据集，图像识别，自然语言处理，迁移学习，模型库，人工智能数据概述：该数据集包含了预训练的深度学习模型，这些模型在各种数据集上进行了训练，可以用于多种下游任务。主要特征如下：...

ZIP

Gemma模型微调综合编码数据集-malakafaqahmad

2025年5月29日 30 57 29

Gemma模型微调综合编码数据集-malakafaqahmad 数据来源：互联网公开数据标签：编码，数据集，机器学习，自然语言处理，Gemma，模型微调，代码生成，代码理解数据概述：该数据集包含用于Gemma模型微调的综合编码数据，旨在提升模型在代码生成、代码理解等任务上的表现。主要特征如下：...

ZIP

Gemma2模型微调数据集-anshdarji

2025年5月29日 30 185 184

Gemma2模型微调数据集-anshdarji 数据来源：互联网公开数据标签：大语言模型，微调，数据集，自然语言处理，文本生成，机器学习，人工智能，Gemma 数据概述：该数据集包含了用于微调 Gemma 2 模型的数据，旨在提升模型在特定任务上的表现。主要特征如下：时间跨度：数据生成时间随数据集内容而异，涵盖不同时间段的文本信息。...

ZIP

大型语言模型分类微调数据集LLMClassificationFine-tuningDataset-manishkumarpatel13

2025年5月28日 30 52 26

大型语言模型分类微调数据集LLMClassificationFine-tuningDataset-manishkumarpatel13 数据来源：互联网公开数据标签：自然语言处理，机器学习，数据集，文本分类，深度学习，人工智能，语言模型，模型微调数据概述：该数据集专注于大型语言模型（Large Language Model,...

ZIP

大语言模型微调参数数据集Qwen1-5-Llama-Factory-LoRADataset-yuushii

2025年5月14日 30 68 30

大语言模型微调参数数据集Qwen1-5-Llama-Factory-LoRADataset-yuushii 数据来源：互联网公开数据标签：大语言模型，参数微调，数据集，机器学习，深度学习，自然语言处理，人工智能，模型优化数据概述：...

ZIP

FLAN-T5Large模型微调数据集FLAN-T5LargeFinetunedDataset-shailjakanttiwari

2025年5月13日 30 89 31

FLAN-T5Large模型微调数据集FLAN-T5LargeFinetunedDataset-shailjakanttiwari 数据来源：互联网公开数据标签：自然语言处理，数据集，文本生成，机器翻译，模型微调，大规模语言模型，文本摘要，问答系统数据概述：该数据集包含用于微调 FLAN-T5 Large...

ZIP

低秩适应推理结果数据集LoRAInferenceResultsDataset-anastasiazrkn

2025年4月26日 30 1 0

低秩适应推理结果数据集LoRAInferenceResultsDataset-anastasiazrkn 数据来源：互联网公开数据标签：深度学习，模型微调，LoRA技术，推理性能，人工智能，算法优化，计算机科学，机器学习数据概述：...

ZIP

深度学习微调数据集Fine-TuningDataset-inductiveanks

2025年4月25日 30 175 167

深度学习微调数据集Fine-TuningDataset-inductiveanks 数据来源：互联网公开数据标签：深度学习，微调，数据集，机器学习，模型优化，人工智能，算法训练，神经网络数据概述：该数据集包含用于深度学习模型微调的数据，适用于模型优化和性能提升。主要特征如下：时间跨度：数据记录的时间范围从2018年到2022年。...

ZIP

GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12

2025年4月25日 30 205 127

GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12 数据来源：互联网公开数据标签：自然语言处理，数据集，机器学习，语言模型，文本生成，深度学习，人工智能，模型微调数据概述：该数据集包含用于微调GPT-2语言模型的数据，主要记录了文本数据及其相关的标注信息。主要特征如下：...

ZIP

微调研究数据集ResearchonFine-TuningDataset-bonthadasravankumar

2025年4月25日 30 49 2

微调研究数据集ResearchonFine-TuningDataset-bonthadasravankumar 数据来源：互联网公开数据标签：微调研究，数据集，机器学习，深度学习，模型优化，自然语言处理，计算机视觉，人工智能数据概述：该数据集用于研究微调技术在机器学习和深度学习模型中的应用效果，涵盖了多种任务和数据集的微调结果。主要特征如下：...

ZIP

现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong

2025年4月22日 30 11 7

现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong 数据来源：互联网公开数据标签：自然语言处理，数据集，文本分析，机器学习，BERT，模型微调，情感分析，文本分类数据概述：该数据集包含用于微调现代BERT模型的数据，主要记录了用于各种自然语言处理任务的文本信息。主要特征如下：...

ZIP

找到20个数据集

注册成功！