-
大语言模型生成文本指令微调数据集LargeLanguageModelTextGenerationInstructionFine-tuningDataset...
大语言模型生成文本指令微调数据集LargeLanguageModelTextGenerationInstructionFine-tuningDataset-mohamedlotfy50 数据来源:互联网公开数据 标签:大语言模型, 文本生成, 指令微调, 自然语言处理, 文本分类, 机器翻译, 数据标注, 知识问答 数据概述:... -
大规模语言模型嵌入与重排序研究代码数据集LargeLanguageModelEmbeddingandRerankingResearchCode-djc020623nzh
大规模语言模型嵌入与重排序研究代码数据集LargeLanguageModelEmbeddingandRerankingResearchCode-djc020623nzh 数据来源:互联网公开数据 标签:自然语言处理, 机器学习, 深度学习, 文本嵌入, 重排序, 模型训练, 代码, 预训练模型, 大语言模型 数据概述:... -
大型语言模型生成文本数据集LargeLanguageModelGeneratedTextDataset-asalhi
大型语言模型生成文本数据集LargeLanguageModelGeneratedTextDataset-asalhi 数据来源:互联网公开数据 标签:大语言模型, 文本生成, 机器生成文本, 自然语言处理, 文本分析, 数据集, 机器学习, 写作辅助 数据概述: 该数据集包含由大型语言模型(LLM)生成的文本数据,涵盖多个主题和场景。主要特征如下:... -
文本改写提示词预测数据集TextRewritingPromptPredictionDataset-garried
文本改写提示词预测数据集TextRewritingPromptPredictionDataset-garried 数据来源:互联网公开数据 标签:文本改写, 提示词预测, 自然语言处理, 大语言模型, 文本生成, 数据分析, 机器学习, 语义理解 数据概述:... -
数学问题解答生成数据集MathematicsProblemSolvingGeneration-zhenlanwang
数学问题解答生成数据集MathematicsProblemSolvingGeneration-zhenlanwang 数据来源:互联网公开数据 标签:数学问题, 文本生成, 大语言模型, 问题解答, 自然语言处理, 数据集构建, 数学教育, 模型训练 数据概述:... -
Prompt指令生成与评估数据集PromptGenerationandEvaluationDataset-sandeepnambiar02
Prompt指令生成与评估数据集PromptGenerationandEvaluationDataset-sandeepnambiar02 数据来源:互联网公开数据 标签:Prompt工程, 人工智能, 自然语言处理, 文本生成, 指令调优, 大语言模型, 数据标注, 评估指标 数据概述:... -
大语言模型生成文本评估数据集LargeLanguageModelGeneratedTextEvaluationDataset-liziyifromjlu
大语言模型生成文本评估数据集LargeLanguageModelGeneratedTextEvaluationDataset-liziyifromjlu 数据来源:互联网公开数据 标签:大语言模型, 文本生成, 评估, 文本质量, 误导性, 事实性, 对抗样本, 模型鲁棒性 数据概述:... -
大语言模型GPT4摘要数据集TestLLMGPT4SummariesasReferenceDataset-pranshubahadur
大语言模型GPT4摘要数据集TestLLMGPT4SummariesasReferenceDataset-pranshubahadur 数据来源:互联网公开数据 标签:大语言模型,GPT4,摘要,文本分析,机器学习,自然语言处理,数据集,参考材料... -
LLM模型验证数据集ValidationLLMDataset-arunsensei
LLM模型验证数据集ValidationLLMDataset-arunsensei 数据来源:互联网公开数据 标签:LLM,大语言模型,验证,评估,自然语言处理,NLP,文本分析,机器学习 数据概述:该数据集包含用于验证和评估大型语言模型(LLM)性能的数据,记录了各种类型的文本数据和相应的评估指标。主要特征如下:... -
AlpacaGPT4中文数据集AlpacaGPT4ChineseDataset-airzip
AlpacaGPT4中文数据集AlpacaGPT4ChineseDataset-airzip 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,数据集,文本生成,机器学习,人工智能,机器翻译,智能对话 数据概述: 该数据集包含来自 Alpaca GPT4 项目的中文数据,记录了用于训练和优化大型语言模型的高质量文本数据。主要特征如下:... -
大语言模型参数高效微调训练数据集
大语言模型参数高效微调训练数据集 数据来源:互联网公开数据 标签:大语言模型,参数高效微调,低秩适应,对话摘要,对话主题,对话内容,训练数据 数据概述:... -
HuggingFaceGGUF模型数据集-igalbronshtein
HuggingFaceGGUF模型数据集-igalbronshtein 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,GGUF,量化,推理,模型优化,Hugging Face,AI 数据概述: 该数据集包含了Hugging Face社区提供的GGUF模型文件,这些模型文件是经过量化处理的,旨在优化模型在不同硬件上的推理性能。主要特征如下:... -
大语言模型性能基准评测数据集-dustalov
大语言模型性能基准评测数据集-dustalov 数据来源:互联网公开数据 标签:大语言模型,模型评估,基准测试,机器反馈,人类反馈,语言技术,模型比较 数据概述: 本数据集包含了一系列基于精心挑选的提示(prompts)和不同大语言模型(LLM)的成对响应比较结果。这些比较结果结合了人类和机器的反馈,旨在构建一个简洁的大语言模型排行榜(LLMFAO... -
大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer
大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer 数据来源:互联网公开数据 标签:大语言模型,提示恢复,数据集,自然语言处理,机器学习,人工智能,文本生成,对话系统 数据概述:该数据集包含用于大语言模型提示恢复的文本数据,记录了原始提示和相应的恢复提示。主要特征如下:... -
Mistral-8k困惑度评估数据集-hozaifazaki
Mistral-8k困惑度评估数据集-hozaifazaki 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,困惑度,评估,数据集,文本分析,机器翻译,生成模型 数据概述:该数据集包含用于评估Mistral-8k大语言模型困惑度的文本数据,旨在衡量模型对不同文本序列的理解和预测能力。主要特征如下: 时间跨度:数据记录时间范围不限,持续更新。... -
大语言模型与科学问题识别数据集LLM-SE-SciQ-2k-ValidDataset-yingpengchen
大语言模型与科学问题识别数据集LLM-SE-SciQ-2k-ValidDataset-yingpengchen 数据来源:互联网公开数据 标签:大语言模型,科学问题,数据集,自然语言处理,机器学习,知识图谱,科学教育,人工智能 数据概述: 该数据集包含来自大语言模型与科学问题识别研究的数据,记录了科学问题的文本内容及其相关特征。主要特征如下:... -
大语言模型科学考试训练数据集AdditionalTrainDataforLLMScienceExam-zhiqingfang
大语言模型科学考试训练数据集AdditionalTrainDataforLLMScienceExam-zhiqingfang 数据来源:互联网公开数据 标签:大语言模型,科学考试,训练数据,教育数据,机器学习,自然语言处理,学术研究,数据集 数据概述:该数据集包含用于训练大语言模型的科学考试相关数据,记录了各类科学考试的题目和答案等信息。主要特征如下:... -
LLM基线模型评测数据集-aditya21511
LLM基线模型评测数据集-aditya21511 数据来源:互联网公开数据 标签:大语言模型,LLM,基线模型,评测,NLP,自然语言处理,基准测试,性能评估 数据概述: 该数据集包含用于评估大语言模型(LLM)性能的基线模型评测数据,用于衡量LLM在不同任务上的表现。主要特征如下: 时间跨度:数据集涵盖了当前LLM发展阶段的多个时间点。... -
Gemini模型ReAct框架在Kaggle环境下的轨迹数据集-penpentled
Gemini模型ReAct框架在Kaggle环境下的轨迹数据集-penpentled 数据来源:互联网公开数据 标签:大语言模型,LLM,ReAct,Gemini,Kaggle,轨迹数据,机器学习,Agent 数据概述: 本数据集包含了使用Gemini模型在Kaggle环境中生成的ReAct(Reasoning and... -
大语言模型生成文本检测数据集
大语言模型生成文本检测数据集 数据来源:互联网公开数据 标签:大语言模型,文本检测,机器学习,数据合成,竞争数据 数据概述: 本数据集来自Kaggle竞赛“LLM - Detect AI Generated...