找到661个数据集

标签: 文本生成

过滤结果
  • 心理健康对话上下文数据集MentalHealthConversationContext-Response-poornimamarini

    2025年4月29日   

    心理健康对话上下文数据集MentalHealthConversationContext-Response-poornimamarini 数据来源:互联网公开数据 标签:心理健康, 对话分析, 情感分析, 文本生成, 自然语言处理, 情绪识别, 问答系统, 语料库 数据概述:...
    packageimg
  • 通用问答系统对话数据集GeneralQuestionAnsweringDialogueDataset-lolqwyt

    2025年4月29日   

    通用问答系统对话数据集GeneralQuestionAnsweringDialogueDataset-lolqwyt 数据来源:互联网公开数据 标签:问答系统, 对话, 自然语言处理, 文本生成, 语料库, 机器学习, 对话理解, 知识检索 数据概述: 该数据集包含来自互联网的问答对话数据,记录了用户提出的问题以及系统的回答。主要特征如下:...
    packageimg
  • 新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14

    2025年4月29日   

    新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14 数据来源:互联网公开数据 标签:新闻摘要, 自然语言处理, 文本生成, 机器翻译, 文本摘要, 验证数据集, 深度学习, 语料库 数据概述:...
    packageimg
  • 餐厅推荐对话数据集RestaurantRecommendationDialogueDataset-sushii2512

    2025年4月29日   

    餐厅推荐对话数据集RestaurantRecommendationDialogueDataset-sushii2512 数据来源:互联网公开数据 标签:对话系统, 餐厅推荐, 自然语言处理, 意图识别, 槽位填充, 对话管理, 文本生成, 数据集 数据概述: 该数据集包含餐厅推荐对话数据,记录了用户与对话系统之间关于餐厅信息的交互过程。主要特征如下:...
    packageimg
  • AI竞赛DAIGT文本生成检测数据集

    2025年4月27日   

    AI竞赛DAIGT文本生成检测数据集 数据来源:互联网公开数据 标签:文本生成, AI检测, 竞赛数据, 自然语言处理, 逆向工程, 替换映射, 文本匹配 数据概述:...
    packageimg
  • 新闻摘要生成数据集XSumCSVDataset-sidop21

    2025年4月26日   

    新闻摘要生成数据集XSumCSVDataset-sidop21 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,新闻分析,文本生成,数据挖掘,信息提取 数据概述: 该数据集源自XSum项目,专注于新闻文章的摘要生成任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,具体时间信息未提供。...
    packageimg
  • 语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500

    2025年4月26日   

    语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,语言模型,机器学习,人工智能,机器翻译,对话系统 数据概述: 该数据集包含来自Alpaca和FLAN语言模型的生成文本数据,记录了语言模型在多种任务中的文本生成结果。主要特征如下:...
    packageimg
  • 大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks

    2025年4月26日   

    大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,微调,文本生成,机器翻译,问答系统,深度学习 数据概述: 该数据集包含用于微调大规模语言模型的数据,涵盖了多种自然语言处理任务。主要特征如下:...
    packageimg
  • 问答系统评估数据集Qwen-AnswersDataset-martintura

    2025年4月26日   

    问答系统评估数据集Qwen-AnswersDataset-martintura 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,人工智能,知识图谱,信息检索,文本生成 数据概述: 该数据集包含来自问答系统Qwen的问答对数据,记录了用户提出的问题和系统生成的答案。主要特征如下:...
    packageimg
  • Quora语句改写数据集QuoraParaphrasingDataset-fbgame123

    2025年4月26日   

    Quora语句改写数据集QuoraParaphrasingDataset-fbgame123 数据来源:互联网公开数据 标签:自然语言处理,文本改写,数据集,机器学习,语义相似度,语言模型,文本生成,人工智能 数据概述: 该数据集来源于Quora平台,包含了用户提问的原始语句及对应的改写版本,用于研究语句改写和语义相似度分析。主要特征如下:...
    packageimg
  • 测试MisralLLaMA与ChatGPT差异数据集TestMisralLLaMAChatGPTDifferSet-alexeyj

    2025年4月26日   

    测试MisralLLaMA与ChatGPT差异数据集TestMisralLLaMAChatGPTDifferSet-alexeyj 数据来源:互联网公开数据 标签:对话系统,语言模型,数据集,自然语言处理,机器学习,人工智能,文本生成,比较分析 数据概述: 该数据集包含了Misral...
    packageimg
  • 合成心理健康对话数据集-denisemtatih

    2025年4月26日   

    合成心理健康对话数据集-denisemtatih 数据来源:互联网公开数据 标签:心理健康,对话,数据集,自然语言处理,情感分析,文本生成,机器学习,人机交互 数据概述: 该数据集包含合成的心理健康对话记录,旨在模拟患者与治疗师或支持性人工智能之间的交流。主要特征如下: 时间跨度:数据记录未明确时间跨度,主要关注对话内容和情感表达。...
    packageimg
  • 贝叶斯方法微调大型语言模型数据集LLM-finetuningBayesianDataset-tylerchun91

    2025年4月26日   

    贝叶斯方法微调大型语言模型数据集LLM-finetuningBayesianDataset-tylerchun91 数据来源:互联网公开数据 标签:大型语言模型,贝叶斯方法,微调,数据集,自然语言处理,机器学习,模型优化,文本生成 数据概述: 该数据集包含用于贝叶斯方法微调大型语言模型的数据,旨在提升模型性能和泛化能力。主要特征如下:...
    packageimg
  • 生成式数据集2000年GenerateDF2000-mandrilator

    2025年4月26日   

    生成式数据集2000年GenerateDF2000-mandrilator 数据来源:互联网公开数据 标签:生成数据,数据集,机器学习,自然语言处理,文本生成,人工智能,数据科学,语言模型 数据概述:该数据集包含来自互联网的多样化文本数据,主要记录了2000年期间的文本信息,适用于生成式模型的训练和文本生成任务。主要特征如下:...
    packageimg
  • EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92

    2025年4月26日   

    EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:...
    packageimg
  • 生成式图像标题数据集GenerateCaptionsDataset-ilhamdirgantara

    2025年4月26日   

    生成式图像标题数据集GenerateCaptionsDataset-ilhamdirgantara 数据来源:互联网公开数据 标签:图像识别,自然语言处理,数据集,生成式模型,计算机视觉,人工智能,机器学习,文本生成 数据概述: 该数据集包含来自公开图像资源的数据,记录了图像与对应标题的配对信息。主要特征如下:...
    packageimg
  • 自然语言处理BeamSearch结果数据集-r00man

    2025年4月26日   

    自然语言处理BeamSearch结果数据集-r00man 数据来源:互联网公开数据 标签:自然语言处理,Beam Search,数据集,文本生成,机器翻译,序列标注,深度学习,模型评估 数据概述: 该数据集包含了使用Beam Search算法生成的自然语言处理任务结果。主要特征如下: 时间跨度:数据生成时间为特定任务训练和推理的时间。...
    packageimg
  • 预处理与摘要生成数据集Pre-Proc-SumDataset-mohit3430

    2025年4月26日   

    预处理与摘要生成数据集Pre-Proc-SumDataset-mohit3430 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,文本预处理,信息提取,文本生成,深度学习 数据概述: 该数据集专注于文本预处理与摘要生成任务,记录了原始文本及其对应的预处理结果和自动生成的摘要。主要特征如下:...
    packageimg
  • 诗歌生成数据集PoemGenerationDataset-neorangna

    2025年4月26日   

    诗歌生成数据集PoemGenerationDataset-neorangna 数据来源:互联网公开数据 标签:自然语言处理,诗歌,文本生成,机器学习,中文数据,文学创作,深度学习,数据集 数据概述: 该数据集包含来自中文诗歌创作的大量文本数据,记录了不同风格和体裁的古代及现代诗歌作品。主要特征如下:...
    packageimg
  • Midjourney随机生成图像提示语数据集-百万条

    2025年4月26日   

    Midjourney随机生成图像提示语数据集-百万条 数据来源:互联网公开数据 标签:Midjourney,图像生成,AI绘画,提示词,文本生成,随机,创作灵感,艺术,数据集 数据概述:...
    packageimg