数据集 - 海数据

提示词指令微调数据集PromptInstructionFine-tuningDataset-eightina

2025年5月12日

提示词指令微调数据集PromptInstructionFine-tuningDataset-eightina 数据来源：互联网公开数据标签：提示词, 指令微调, 自然语言处理, 大语言模型, 文本生成, 机器学习, 对话生成, 语料库数据概述：该数据集包含来自开源社区的提示词与对应指令示例，旨在用于大语言模型的指令微调。主要特征如下：...

ZIP

大语言模型安全提示词与对抗样本数据集LargeLanguageModelSafetyPromptandAdversarialSampleDataset-a...

2025年5月11日

大语言模型安全提示词与对抗样本数据集LargeLanguageModelSafetyPromptandAdversarialSampleDataset-arielzilber 数据来源：互联网公开数据标签：大语言模型, 提示词, 对抗样本, 安全性, 文本生成, 恶意攻击, 深度学习, 自然语言处理数据概述：...

ZIP

大语言模型生成文本指令微调数据集LargeLanguageModelTextGenerationInstructionFine-tuningDataset...

2025年5月10日

大语言模型生成文本指令微调数据集LargeLanguageModelTextGenerationInstructionFine-tuningDataset-mohamedlotfy50 数据来源：互联网公开数据标签：大语言模型, 文本生成, 指令微调, 自然语言处理, 文本分类, 机器翻译, 数据标注, 知识问答数据概述：...

ZIP

大规模语言模型嵌入与重排序研究代码数据集LargeLanguageModelEmbeddingandRerankingResearchCode-djc020623nzh

2025年5月7日

大规模语言模型嵌入与重排序研究代码数据集LargeLanguageModelEmbeddingandRerankingResearchCode-djc020623nzh 数据来源：互联网公开数据标签：自然语言处理, 机器学习, 深度学习, 文本嵌入, 重排序, 模型训练, 代码, 预训练模型, 大语言模型数据概述：...

ZIP

大型语言模型生成文本数据集LargeLanguageModelGeneratedTextDataset-asalhi

2025年5月7日

大型语言模型生成文本数据集LargeLanguageModelGeneratedTextDataset-asalhi 数据来源：互联网公开数据标签：大语言模型, 文本生成, 机器生成文本, 自然语言处理, 文本分析, 数据集, 机器学习, 写作辅助数据概述：该数据集包含由大型语言模型（LLM）生成的文本数据，涵盖多个主题和场景。主要特征如下：...

ZIP

文本改写提示词预测数据集TextRewritingPromptPredictionDataset-garried

2025年5月1日

文本改写提示词预测数据集TextRewritingPromptPredictionDataset-garried 数据来源：互联网公开数据标签：文本改写, 提示词预测, 自然语言处理, 大语言模型, 文本生成, 数据分析, 机器学习, 语义理解数据概述：...

ZIP

数学问题解答生成数据集MathematicsProblemSolvingGeneration-zhenlanwang

2025年4月29日

数学问题解答生成数据集MathematicsProblemSolvingGeneration-zhenlanwang 数据来源：互联网公开数据标签：数学问题, 文本生成, 大语言模型, 问题解答, 自然语言处理, 数据集构建, 数学教育, 模型训练数据概述：...

ZIP

Prompt指令生成与评估数据集PromptGenerationandEvaluationDataset-sandeepnambiar02

2025年4月29日

Prompt指令生成与评估数据集PromptGenerationandEvaluationDataset-sandeepnambiar02 数据来源：互联网公开数据标签：Prompt工程, 人工智能, 自然语言处理, 文本生成, 指令调优, 大语言模型, 数据标注, 评估指标数据概述：...

ZIP

大语言模型生成文本评估数据集LargeLanguageModelGeneratedTextEvaluationDataset-liziyifromjlu

2025年4月29日

大语言模型生成文本评估数据集LargeLanguageModelGeneratedTextEvaluationDataset-liziyifromjlu 数据来源：互联网公开数据标签：大语言模型, 文本生成, 评估, 文本质量, 误导性, 事实性, 对抗样本, 模型鲁棒性数据概述：...

ZIP

大语言模型GPT4摘要数据集TestLLMGPT4SummariesasReferenceDataset-pranshubahadur

2025年4月26日

大语言模型GPT4摘要数据集TestLLMGPT4SummariesasReferenceDataset-pranshubahadur 数据来源：互联网公开数据标签：大语言模型，GPT4，摘要，文本分析，机器学习，自然语言处理，数据集，参考材料...

ZIP

LLM模型验证数据集ValidationLLMDataset-arunsensei

2025年4月25日

LLM模型验证数据集ValidationLLMDataset-arunsensei 数据来源：互联网公开数据标签：LLM，大语言模型，验证，评估，自然语言处理，NLP，文本分析，机器学习数据概述：该数据集包含用于验证和评估大型语言模型（LLM）性能的数据，记录了各种类型的文本数据和相应的评估指标。主要特征如下：...

ZIP

AlpacaGPT4中文数据集AlpacaGPT4ChineseDataset-airzip

2025年4月24日

AlpacaGPT4中文数据集AlpacaGPT4ChineseDataset-airzip 数据来源：互联网公开数据标签：自然语言处理，大语言模型，数据集，文本生成，机器学习，人工智能，机器翻译，智能对话数据概述：该数据集包含来自 Alpaca GPT4 项目的中文数据，记录了用于训练和优化大型语言模型的高质量文本数据。主要特征如下：...

ZIP

大语言模型参数高效微调训练数据集

2025年4月24日

大语言模型参数高效微调训练数据集数据来源：互联网公开数据标签：大语言模型,参数高效微调,低秩适应,对话摘要,对话主题,对话内容,训练数据数据概述：...

ZIP

HuggingFaceGGUF模型数据集-igalbronshtein

2025年4月24日

HuggingFaceGGUF模型数据集-igalbronshtein 数据来源：互联网公开数据标签：自然语言处理，大语言模型，GGUF，量化，推理，模型优化，Hugging Face，AI 数据概述：该数据集包含了Hugging Face社区提供的GGUF模型文件，这些模型文件是经过量化处理的，旨在优化模型在不同硬件上的推理性能。主要特征如下：...

ZIP

大语言模型性能基准评测数据集-dustalov

2025年4月24日

大语言模型性能基准评测数据集-dustalov 数据来源：互联网公开数据标签：大语言模型,模型评估,基准测试,机器反馈,人类反馈,语言技术,模型比较数据概述：本数据集包含了一系列基于精心挑选的提示（prompts）和不同大语言模型（LLM）的成对响应比较结果。这些比较结果结合了人类和机器的反馈，旨在构建一个简洁的大语言模型排行榜（LLMFAO...

ZIP

大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer

2025年4月24日

大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer 数据来源：互联网公开数据标签：大语言模型，提示恢复，数据集，自然语言处理，机器学习，人工智能，文本生成，对话系统数据概述：该数据集包含用于大语言模型提示恢复的文本数据，记录了原始提示和相应的恢复提示。主要特征如下：...

ZIP

Mistral-8k困惑度评估数据集-hozaifazaki

2025年4月24日

Mistral-8k困惑度评估数据集-hozaifazaki 数据来源：互联网公开数据标签：自然语言处理，大语言模型，困惑度，评估，数据集，文本分析，机器翻译，生成模型数据概述：该数据集包含用于评估Mistral-8k大语言模型困惑度的文本数据，旨在衡量模型对不同文本序列的理解和预测能力。主要特征如下：时间跨度：数据记录时间范围不限，持续更新。...

ZIP

大语言模型与科学问题识别数据集LLM-SE-SciQ-2k-ValidDataset-yingpengchen

2025年4月23日

大语言模型与科学问题识别数据集LLM-SE-SciQ-2k-ValidDataset-yingpengchen 数据来源：互联网公开数据标签：大语言模型，科学问题，数据集，自然语言处理，机器学习，知识图谱，科学教育，人工智能数据概述：该数据集包含来自大语言模型与科学问题识别研究的数据，记录了科学问题的文本内容及其相关特征。主要特征如下：...

ZIP

大语言模型科学考试训练数据集AdditionalTrainDataforLLMScienceExam-zhiqingfang

2025年4月23日

大语言模型科学考试训练数据集AdditionalTrainDataforLLMScienceExam-zhiqingfang 数据来源：互联网公开数据标签：大语言模型，科学考试，训练数据，教育数据，机器学习，自然语言处理，学术研究，数据集数据概述：该数据集包含用于训练大语言模型的科学考试相关数据，记录了各类科学考试的题目和答案等信息。主要特征如下：...

ZIP

LLM基线模型评测数据集-aditya21511

2025年4月22日

LLM基线模型评测数据集-aditya21511 数据来源：互联网公开数据标签：大语言模型，LLM，基线模型，评测，NLP，自然语言处理，基准测试，性能评估数据概述：该数据集包含用于评估大语言模型（LLM）性能的基线模型评测数据，用于衡量LLM在不同任务上的表现。主要特征如下：时间跨度：数据集涵盖了当前LLM发展阶段的多个时间点。...

ZIP

找到50个数据集

注册成功！