找到661个数据集

标签: 文本生成

过滤结果
  • 食谱生成数据集RecipeGenerationDataset-devisricharan5

    2025年4月25日   

    食谱生成数据集RecipeGenerationDataset-devisricharan5 数据来源:互联网公开数据 标签:食谱,菜谱,食谱生成,自然语言处理,文本生成,烹饪,数据集,机器学习 数据概述: 该数据集包含来自各种来源的食谱数据,记录了各种菜肴的详细信息。主要特征如下: 时间跨度:...
    packageimg
  • Mistral-7B生成文本数据集-thienanlnguyen

    2025年4月25日   

    Mistral-7B生成文本数据集-thienanlnguyen 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,机器学习,语言模型,生成式AI,文本分析,人工智能 数据概述: 该数据集包含由 Mistral-7B 语言模型生成的文本数据,用于研究和评估模型的文本生成能力。主要特征如下: 时间跨度:数据生成时间为近期。...
    packageimg
  • 大型语言模型数据集LlamaDataset-simakov

    2025年4月25日   

    大型语言模型数据集LlamaDataset-simakov 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,人工智能,文本生成 数据概述: 该数据集包含 Llama 项目收集的用于训练大型语言模型的数据,旨在支持文本生成,对话理解等多种自然语言处理任务。主要特征如下:...
    packageimg
  • GPT生成文本数据集GPT-GeneratedTextDataset-manshanand

    2025年4月25日   

    GPT生成文本数据集GPT-GeneratedTextDataset-manshanand 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,机器学习,人工智能,语言模型,文本分析,深度学习 数据概述: 该数据集包含由GPT(生成预训练转换器)模型生成的文本数据,记录了模型在不同输入下的输出文本。主要特征如下:...
    packageimg
  • 句子生成脚本数据集SentenceScriptDataset-indunil19

    2025年4月25日   

    句子生成脚本数据集SentenceScriptDataset-indunil19 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,深度学习,语言模型,文本分析,人工智能,写作辅助 数据概述: 该数据集包含用于句子生成的脚本数据,记录了各种主题和风格的句子及相关信息。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于脚本的创作时间。...
    packageimg
  • TensorFlow句子自动补全数据集-subho117

    2025年4月25日   

    TensorFlow句子自动补全数据集-subho117 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,深度学习,TensorFlow,自动补全,语言模型,文本分析 数据概述: 该数据集包含用于训练TensorFlow句子自动补全模型的文本数据,旨在实现对用户输入的句子进行智能补全。主要特征如下: 时间跨度:...
    packageimg
  • JupyterNotebook提示词数据集JB-PromptsV2-balrajprajesh

    2025年4月25日   

    JupyterNotebook提示词数据集JB-PromptsV2-balrajprajesh 数据来源:互联网公开数据 标签:自然语言处理,提示词工程,数据集,机器学习,文本生成,人工智能,Jupyter Notebook,prompt 数据概述:该数据集包含了用于 Jupyter Notebook...
    packageimg
  • Llama1模型生成第一步数据集Generation1Step1Dataset-thaonguen

    2025年4月25日   

    Llama1模型生成第一步数据集Generation1Step1Dataset-thaonguen 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,机器学习,Llama,Transformer,语言模型,预训练 数据概述: 该数据集包含用于 Llama 1 模型第一步训练的数据,主要用于构建基础的语言模型。主要特征如下:...
    packageimg
  • 大型语言模型生成器数据集LLMS生成器数据集-ranimmhisham

    2025年4月25日   

    大型语言模型生成器数据集LLMS生成器数据集-ranimmhisham 数据来源:互联网公开数据 标签:语言模型,生成器,数据集,自然语言处理,机器学习,文本生成,人工智能,深度学习 数据概述:该数据集包含来自多个来源的文本数据,用于训练大型语言模型生成器,记录了各种类型的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda

    2025年4月25日   

    大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,大型语言模型,评估数据集,模型测评,文本生成,人工智能,学术研究 数据概述: 该数据集包含用于评估大型语言模型(LLM)总结能力的文本数据。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。...
    packageimg
  • 图像标注数据集Caption-THDataset-yaomingzz

    2025年4月25日   

    图像标注数据集Caption-THDataset-yaomingzz 数据来源:互联网公开数据 标签:图像标注,数据集,计算机视觉,自然语言处理,图像识别,机器学习,视觉理解,文本生成 数据概述: 该数据集包含大量图像及其对应的文本描述,记录了图像内容与文字标注的配对数据。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为近期数据。...
    packageimg
  • 基于ChatGPT的邮政编码生成数据集PostcodeGeneratorUsingChatGPTDataset-oladayoowoeye

    2025年4月25日   

    基于ChatGPT的邮政编码生成数据集PostcodeGeneratorUsingChatGPTDataset-oladayoowoeye 数据来源:互联网公开数据 标签:邮政编码,数据生成,自然语言处理,人工智能,机器学习,数据集,文本生成,智能编码 数据概述:...
    packageimg
  • GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr

    2025年4月25日   

    GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,深度学习,文本分析 数据概述:该数据集包含了由GPT4再生成的语言模型数据,适用于自然语言处理,文本生成等任务。主要特征如下:...
    packageimg
  • 通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi

    2025年4月25日   

    通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,教育技术 数据概述:该数据集包含用于文本摘要生成任务的通用测试数据,记录了多个文本及其对应的摘要信息。主要特征如下:...
    packageimg
  • 文本生成预测数据集NextWordGenerateDataset-anirudhasutar

    2025年4月25日   

    文本生成预测数据集NextWordGenerateDataset-anirudhasutar 数据来源:互联网公开数据 标签:文本生成,数据集,自然语言处理,机器学习,人工智能,语言模型,文本预测,深度学习 数据概述:该数据集包含用于文本生成预测的数据,记录了大量文本数据以训练和评估语言模型。主要特征如下:...
    packageimg
  • 双子星长文本数据集GeminiLongContextDataset-akinduhiman

    2025年4月25日   

    双子星长文本数据集GeminiLongContextDataset-akinduhiman 数据来源:互联网公开数据 标签:自然语言处理,长文本分析,数据集,机器学习,文本生成,语言模型,学术研究,人工智能 数据概述:该数据集包含来自双子星项目的长文本数据,记录了多种类型的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • ArgRewritev2语料库数据集-nghtctrl

    2025年4月25日   

    ArgRewritev2语料库数据集-nghtctrl 数据来源:互联网公开数据 标签:自然语言处理,语料库,文本生成,机器翻译,文本重写,数据集,语言模型,文本分析 数据概述: 该数据集包含 ArgRewrite v2 语料库的数据,记录了文本重写任务的多种变体。主要特征如下: 时间跨度:数据记录的时间范围为数据集构建和发布时间。...
    packageimg
  • GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12

    2025年4月25日   

    GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,文本生成,深度学习,人工智能,模型微调 数据概述: 该数据集包含用于微调GPT-2语言模型的数据,主要记录了文本数据及其相关的标注信息。主要特征如下:...
    packageimg
  • 生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi

    2025年4月25日   

    生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi 数据来源:互联网公开数据 标签:自然语言处理,生成式AI,数据集,机器学习,语言模型,文本生成,深度学习,人工智能 数据概述: 该数据集包含来自生成式预训练模型与大型语言模型(LLM)的研究数据,记录了模型在文本生成,语言理解等方面的表现。主要特征如下:...
    packageimg
  • GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri

    2025年4月25日   

    GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源:互联网公开数据 标签:自然语言处理,数据集,印尼语,GPT-2,文本生成,语言模型,机器翻译,文本分析 数据概述: 该数据集包含了印尼语文本数据,旨在用于训练和评估GPT-2模型,从而提升印尼语文本生成,翻译等相关任务的性能。主要特征如下:...
    packageimg