找到749个数据集

标签: 文本生成

过滤结果
  • 大规模高质量中文基准模型数据集LGQBMModelV2Dataset-pnepapin

    2025年4月24日   

    大规模高质量中文基准模型数据集LGQBMModelV2Dataset-pnepapin 数据来源:互联网公开数据 标签:自然语言处理,大规模,中文,基准模型,数据集,文本生成,语言理解,机器学习,人工智能 数据概述: 该数据集是LGQBM(大规模高质量中文基准模型)项目的一部分,旨在支持中文自然语言处理(NLP)模型的训练和评估。主要特征如下:...
    packageimg
  • 基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873

    2025年4月24日   

    基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,语言模型,人工智能,文本生成,情感分析 数据概述: 该数据集由基因模型优化项目提供,主要记录了微型聊天机器人在不同对话场景下的交互数据。主要特征如下:...
    packageimg
  • 文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564

    2025年4月24日   

    文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,序列到序列模型,机器学习,文本生成,深度学习,信息提取 数据概述: 该数据集专注于文本摘要生成任务,记录了大量的文本及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围从过去几年到近期。...
    packageimg
  • 无事实依据的笑话数据集-j0hann

    2025年4月24日   

    无事实依据的笑话数据集-j0hann 数据来源:互联网公开数据 标签:笑话,数据集,文本分析,自然语言处理,情感分析,娱乐,语言学,机器学习 数据概述: 该数据集包含了大量无事实依据的笑话,旨在用于文本分析,自然语言处理和机器学习模型训练。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和来源的笑话。...
    packageimg
  • 图像描述生成数据集ImageDescriptionGenerationDataset-shredharsssss

    2025年4月24日   

    图像描述生成数据集ImageDescriptionGenerationDataset-shredharsssss 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,深度学习,图像标注,人工智能,文本生成 数据概述: 该数据集包含图像及其对应的文本描述,旨在促进图像描述生成任务的研究和应用。主要特征如下:...
    packageimg
  • 高质量提示词数据集PolishedPromptsDataset-dmitriyab

    2025年4月24日   

    高质量提示词数据集PolishedPromptsDataset-dmitriyab 数据来源:互联网公开数据 标签:自然语言处理,提示词工程,数据集,机器学习,文本生成,人工智能,语言模型,提示优化 数据概述: 该数据集包含经过精心设计和优化的提示词(prompts),用于自然语言处理任务,特别是大语言模型的文本生成。主要特征如下:...
    packageimg
  • 测试训练上下文大型语言模型数据集-quctngngvng

    2025年4月24日   

    测试训练上下文大型语言模型数据集-quctngngvng 数据来源:互联网公开数据 标签:大型语言模型,数据集,自然语言处理,文本生成,机器学习,模型训练,语言模型,上下文学习 数据概述: 该数据集包含用于训练和评估大型语言模型(LLM)的文本数据,专注于测试训练(Test-Train)场景下的上下文学习能力。主要特征如下: 时间跨度:...
    packageimg
  • 开放图片描述数据集CaptionsDatasetPublic-mahipalimkar

    2025年4月24日   

    开放图片描述数据集CaptionsDatasetPublic-mahipalimkar 数据来源:互联网公开数据 标签:图像描述,自然语言处理,计算机视觉,数据集,文本生成,图像识别,多模态学习,人工智能 数据概述: 该数据集包含了大量图像及其对应的文本描述,旨在用于图像描述生成任务。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。...
    packageimg
  • 大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57

    2025年4月24日   

    大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57 数据来源:互联网公开数据 标签:自然语言处理,文本生成,文本校对,数据集,机器翻译,语言模型,文本纠错,人工智能 数据概述: 该数据集基于 Google 的大型语言模型 T5,记录了大规模文本生成和校对的数据。主要特征如下:...
    packageimg
  • 俄罗斯幽默笑话文本数据集

    2025年4月24日   

    俄罗斯幽默笑话文本数据集 数据来源:互联网公开数据 标签:俄罗斯,幽默,笑话,文本,语言学,文化,娱乐 数据概述: 本数据集收录了来自俄罗斯笑话聚合网站的笑话文本。这些笑话内容涵盖了广泛的主题和风格,反映了俄罗斯独特的幽默文化。数据集由IgorVolochay在Hugging Face上发布,原始数据来源于公开的网络资源。 数据用途概述:...
    packageimg
  • 自然语言处理作业三测试数据集-hangman1998

    2025年4月24日   

    自然语言处理作业三测试数据集-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器翻译,文本生成,深度学习,NLP 数据概述:该数据集包含了多个用于自然语言处理任务的测试数据,旨在评估和验证NLP模型的效果。主要特征如下: 时间跨度:数据收集时间不限,涵盖不同年份的文本数据。...
    packageimg
  • 医疗领域GPT问答数据集WebScrappedMedicalGPTDataset-tombraider34

    2025年4月24日   

    医疗领域GPT问答数据集WebScrappedMedicalGPTDataset-tombraider34 数据来源:互联网公开数据 标签:医疗,GPT,问答,数据集,自然语言处理,医学,知识图谱,文本生成 数据概述: 该数据集包含了从互联网上抓取的医疗相关问答数据,旨在用于训练和评估GPT模型在医疗领域的应用。主要特征如下:...
    packageimg
  • Quora-Paraphrase-Stackoverflow-Q-A同义改写数据集QuoraParaphraseStackoverflowQ-ADatas...

    2025年4月24日   

    Quora-Paraphrase-Stackoverflow-Q-A同义改写数据集QuoraParaphraseStackoverflowQ-ADataset-alvations 数据来源:互联网公开数据 标签:自然语言处理,同义改写,数据集,机器学习,语义分析,文本生成,问答系统,数据挖掘 数据概述:...
    packageimg
  • 大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad

    2025年4月24日   

    大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,机器学习,模型评估,语言模型,Llama 70B, Falcon 180B,文本检测,DAIGT,对抗样本 数据概述:...
    packageimg
  • 文本重写训练与测试数据集ParaphraserTrainingandTestSet-pravinkumardurairaj

    2025年4月24日   

    文本重写训练与测试数据集ParaphraserTrainingandTestSet-pravinkumardurairaj 数据来源:互联网公开数据 标签:自然语言处理,文本重写,数据集,机器学习,文本生成,语言模型,深度学习,数据科学 数据概述: 该数据集包含用于训练和测试文本重写模型的平行文本数据,记录了原始文本及其对应的重写版本。主要特征如下:...
    packageimg
  • 新闻摘要生成评估数据集-新闻文章与人工摘要-随机抽样数据

    2025年4月24日   

    新闻摘要生成评估数据集-新闻文章与人工摘要-随机抽样数据 数据来源:互联网公开数据 标签:新闻,摘要,文本摘要,自然语言处理,机器学习,评估,文本分析,内容生成 数据概述:...
    packageimg
  • BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige

    2025年4月24日   

    BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器翻译,文本生成,深度学习,BERT模型 数据概述: 该数据集包含了用于训练和评估BERT模型的基础文本数据,用于构建BERT模型的基线实验。主要特征如下:...
    packageimg
  • 大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer

    2025年4月24日   

    大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer 数据来源:互联网公开数据 标签:大语言模型,提示恢复,数据集,自然语言处理,机器学习,人工智能,文本生成,对话系统 数据概述:该数据集包含用于大语言模型提示恢复的文本数据,记录了原始提示和相应的恢复提示。主要特征如下:...
    packageimg
  • 食谱生成数据集RecipeGenerationDataset-thakkarhiren

    2025年4月24日   

    食谱生成数据集RecipeGenerationDataset-thakkarhiren 数据来源:互联网公开数据 标签:食谱,菜谱,烹饪,数据集,自然语言处理,文本生成,机器学习,菜品推荐 数据概述: 该数据集包含来自互联网的食谱数据,记录了各种菜肴的制作方法和相关信息。主要特征如下: 时间跨度:数据记录的时间范围不限,覆盖了不同年代和地区的菜谱。...
    packageimg
  • WebGPT与OpenAI模型性能对比数据集

    2025年4月24日   

    WebGPT与OpenAI模型性能对比数据集 数据来源:互联网公开数据 标签:WebGPT, OpenAI, 模型对比, 自然语言处理, 文本生成, 性能评估, 机器翻译, 问答系统 数据概述:...
    packageimg