找到749个数据集

标签: 文本生成

过滤结果
  • 组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet

    2025年4月24日   

    组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet 数据来源:互联网公开数据 标签:故事文本,数据集,自然语言处理,文本分析,机器学习,文本生成,数据分析,语言模型 数据概述: 该数据集包含来自多个来源的组合故事文本数据,记录了各类故事文本的内容和结构。主要特征如下:...
    packageimg
  • 大型语言模型生成文本检测竞赛用文集-2023年-phanisrikanth

    2025年4月23日   

    大型语言模型生成文本检测竞赛用文集-2023年-phanisrikanth 数据来源:互联网公开数据 标签:LLM,文本生成,人工智能检测,竞赛数据,英特尔,神经网络,生成文本,论文集 数据概述: 本数据集包含3500篇由大型语言模型(LLM)生成的论文,这些论文是为“Detect AI Generated Text...
    packageimg
  • Skeptoid播客内容复述数据集-sentinel3734

    2025年4月23日   

    Skeptoid播客内容复述数据集-sentinel3734 数据来源:互联网公开数据 标签:Skeptoid,播客,科学,怀疑论,事实核查,内容复述,ChatGPT,人工智能,自然语言处理 数据概述: 本数据集包含了由ChatGPT 3.5和ChatGPT...
    packageimg
  • 性别中立与包容性文本数据集-pravinkalse

    2025年4月23日   

    性别中立与包容性文本数据集-pravinkalse 数据来源:互联网公开数据 标签:性别中立,包容性,文本分析,自然语言处理,社会科学,语言模型,数据集,文本生成 数据概述: 该数据集包含来自互联网的文本数据,旨在促进对性别中立和包容性语言的研究与应用。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和来源的文本。...
    packageimg
  • 大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98

    2025年4月23日   

    大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98 数据来源:互联网公开数据 标签:自然语言处理,大型语言模型,数据集,LLaMA,开源,文本生成,机器学习,预训练 数据概述:...
    packageimg
  • 随机诗歌数据集RandomPoemsDataset-garried

    2025年4月23日   

    随机诗歌数据集RandomPoemsDataset-garried 数据来源:互联网公开数据 标签:诗歌,文学,自然语言处理,文本分析,数据集,文化研究,机器学习,文本生成 数据概述: 该数据集包含来自公开诗歌资源的随机诗歌数据,记录了不同风格和主题的诗歌作品。主要特征如下: 时间跨度:数据记录的时间范围从古代到现代,包含不同历史时期的诗歌作品。...
    packageimg
  • Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham

    2025年4月23日   

    Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,机器学习,文本生成,语言模型,深度学习,数据增强 数据概述: 该数据集由Mistral模型生成,包含大量文本数据,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • 大型语言模型提示恢复竞赛生成的文本数据集-juanmerinobermejo

    2025年4月23日   

    大型语言模型提示恢复竞赛生成的文本数据集-juanmerinobermejo 数据来源:互联网公开数据 标签:LLM,提示恢复,自然语言处理,文本重写,上下文理解,数据集,语言模型 数据概述: 本数据集包含来自LLM提示恢复竞赛的丰富文本数据,每个条目包括原始文本、使用的提示、简化的提示以及AI生成的重写文本。该数据集揭示了Gemma...
    packageimg
  • 法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo

    2025年4月23日   

    法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo 数据来源:互联网公开数据 标签:法语,俚语,翻译,自然语言处理,LLM,Gemma,模型训练,文本数据,语言学,KAIra,文本生成 数据概述:...
    packageimg
  • 巴马腊法语平行语料库数据集-ozaresearch1

    2025年4月23日   

    巴马腊法语平行语料库数据集-ozaresearch1 数据来源:互联网公开数据 标签:巴马腊,法语,平行语料库,机器学习,翻译,文本生成,语言分析 数据概述:...
    packageimg
  • 虚假情感分析训练数据集-2023-caprolal

    2025年4月23日   

    虚假情感分析训练数据集-2023-caprolal 数据来源:互联网公开数据 标签:情感分析,训练数据,假数据,faker库,数据分析,文本生成 数据概述: 本数据集是使用faker库生成的虚假情感分析训练数据集,包含模拟的文本数据及其对应的情感标签。数据集旨在为情感分析模型的训练提供大量合成的数据,适用于数据分析和机器学习任务。数据集包含以下字段:...
    packageimg
  • 大型语言模型Mistral7B指令文本数据集LLMMistral7BInstructTextsDataset-wu468ef

    2025年4月23日   

    大型语言模型Mistral7B指令文本数据集LLMMistral7BInstructTextsDataset-wu468ef 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本生成,语言模型,指令学习,人工智能,深度学习 数据概述: 该数据集包含来自Mistral...
    packageimg
  • 餐厅概览摘要数据集RestaurantOverviewSummarizationDataset-kjeevan

    2025年4月23日   

    餐厅概览摘要数据集RestaurantOverviewSummarizationDataset-kjeevan 数据来源:互联网公开数据 标签:餐厅,摘要,自然语言处理,文本生成,数据集,餐饮业,信息抽取,人工智能 数据概述: 该数据集包含来自互联网的餐厅信息,主要用于生成餐厅概览摘要。主要特征如下:...
    packageimg
  • 强化学习与人类反馈数据RLHF数据集-devanshumahapatra

    2025年4月23日   

    强化学习与人类反馈数据RLHF数据集-devanshumahapatra 数据来源:互联网公开数据 标签:强化学习,人类反馈,数据集,自然语言处理,文本生成,模型训练,人工智能,语言模型 数据概述: 该数据集包含了用于强化学习与人类反馈(RLHF)技术的数据,主要用于训练语言模型,使其生成更符合人类偏好的文本。主要特征如下:...
    packageimg
  • 大规模语言模型增强数据集LLMAugmentedData-zhenghao97

    2025年4月23日   

    大规模语言模型增强数据集LLMAugmentedData-zhenghao97 数据来源:互联网公开数据 标签:语言模型,数据集,数据增强,自然语言处理,文本生成,机器学习,文本分析,人工智能 数据概述: 该数据集包含由大规模语言模型(LLM)生成和增强的文本数据,旨在用于训练和评估各种自然语言处理(NLP)模型。主要特征如下:...
    packageimg
  • 文本重写语料库句子对数据集ArgRewriteV2句子对数据集-nghtctrl

    2025年4月23日   

    文本重写语料库句子对数据集ArgRewriteV2句子对数据集-nghtctrl 数据来源:互联网公开数据 标签:文本重写,数据集,自然语言处理,机器学习,文本生成,语言模型,对齐数据,语义分析 数据概述: 该数据集来自 ArgRewrite 项目,主要包含用于文本重写的句子对数据,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • Flick30图像描述增强数据集EnhancingCaptionsforFlick30Dataset-yazanaboassa

    2025年4月23日   

    Flick30图像描述增强数据集EnhancingCaptionsforFlick30Dataset-yazanaboassa 数据来源:互联网公开数据 标签:图像描述,数据集,自然语言处理,计算机视觉,机器学习,文本生成,数据增强,人工智能 数据概述:...
    packageimg
  • 葡萄牙语诗歌作品集数据库-巴西诗人诗歌-多时期-oliveirasp6

    2025年4月23日   

    葡萄牙语诗歌作品集数据库-巴西诗人诗歌-多时期-oliveirasp6 数据来源:互联网公开数据 标签:诗歌,葡萄牙语,文学,巴西,文本分析,自然语言处理,情感分析,文本生成 数据概述:...
    packageimg
  • 高分辨率名人脸部图像描述数据集CelebA-HQCaptionsDataset-m7mdelganainy

    2025年4月23日   

    高分辨率名人脸部图像描述数据集CelebA-HQCaptionsDataset-m7mdelganainy 数据来源:互联网公开数据 标签:图像描述,人脸识别,数据集,自然语言处理,计算机视觉,深度学习,图像生成,文本生成 数据概述: 该数据集包含 CelebA-HQ 数据集中高分辨率名人脸部图像及其对应的文本描述。主要特征如下:...
    packageimg
  • 数据4KMixtral87B生成文本与AI检测数据集4KMixtral87BCraftedEssaysforDetectAICompDataset-jisukim8873

    2025年4月22日   

    4KMixtral87B生成文本与AI检测数据集4KMixtral87BCraftedEssaysforDetectAICompDataset-jisukim8873 数据来源:互联网公开数据 标签:自然语言处理,文本生成,AI检测,机器学习,数据集,文本分类,深度学习,学术研究 数据概述: 该数据集包含由Mixtral...
    packageimg