找到661个数据集

标签: 文本生成

过滤结果
  • 生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602

    2025年4月25日   

    生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602 数据来源:互联网公开数据 标签:文本生成,自然语言处理,数据集,机器学习,文本分析,人工智能,语言模型,文本挖掘 数据概述: 该数据集包含来自多个公开源文本生成的数据,记录了不同场景下的文本内容和特征。主要特征如下:...
    packageimg
  • 多头模型推理预测数据集MultiheadModelInferencePredictionDataset-datavip

    2025年4月25日   

    多头模型推理预测数据集MultiheadModelInferencePredictionDataset-datavip 数据来源:互联网公开数据 标签:深度学习,多头注意力,模型推理,自然语言处理,数据集,预测分析,机器翻译,文本生成 数据概述: 该数据集包含使用多头注意力机制模型进行推理预测的结果,主要用于评估和分析模型的性能。主要特征如下:...
    packageimg
  • 印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki

    2025年4月24日   

    印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源:互联网公开数据 标签:自然语言处理,印地语,数据集,语言模型,机器学习,文本生成,数据增强,多语言处理 数据概述: 该数据集包含用于印地语大语言模型训练和评估的数据,记录了印地语的文本生成任务所需的数据样本。主要特征如下:...
    packageimg
  • 数据2024中国计算机学会CCF检索增强生成RAG数据集-yxw666

    2025年4月24日   

    2024中国计算机学会CCF检索增强生成RAG数据集-yxw666 数据来源:互联网公开数据 标签:自然语言处理,检索增强生成,数据集,文本生成,信息检索,机器学习,人工智能,CCF 数据概述: 该数据集由中国计算机学会(CCF)提供,旨在促进检索增强生成(RAG)技术的研究与发展。主要特征如下: 时间跨度:数据记录的时间范围为2024年。...
    packageimg
  • 改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07

    2025年4月24日   

    改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,深度学习,文本生成,视觉理解,人工智能 数据概述: 该数据集包含经过改进的图像字幕数据,记录了与图像内容相匹配的,经过优化的描述性文本。主要特征如下:...
    packageimg
  • 文本生成模型Gemma数据集-minhsienweng

    2025年4月24日   

    文本生成模型Gemma数据集-minhsienweng 数据来源:互联网公开数据 标签:文本生成,机器学习,自然语言处理,数据集,人工智能,语言模型,深度学习,文本分析...
    packageimg
  • 基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14

    2025年4月24日   

    基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本生成,机器学习,数据挖掘,OpenAI,数据分析 数据概述: 该数据集包含由OpenAI模型生成的各种文本数据,涵盖了广泛的主题和应用场景。主要特征如下:...
    packageimg
  • 通义千问问答结果数据集Qwen-QAResultsDataset-bartamin

    2025年4月24日   

    通义千问问答结果数据集Qwen-QAResultsDataset-bartamin 数据来源:互联网公开数据 标签:问答,自然语言处理,数据集,文本生成,模型评估,机器学习,人工智能,语言模型 数据概述: 该数据集包含了通义千问(Qwen)大语言模型的问答结果,记录了模型对不同问题的回答。主要特征如下: 时间跨度:数据记录的时间范围为发布时间。...
    packageimg
  • 自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor

    2025年4月24日   

    自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor 数据来源:互联网公开数据 标签:自然语言处理,文本到文本,数据集,机器学习,深度学习,语言模型,翻译,文本生成 数据概述: 该数据集包含自然语言处理中的文本到文本转换任务数据,记录了输入文本和对应的输出文本。主要特征如下: 时间跨度:...
    packageimg
  • 人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara

    2025年4月24日   

    人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara 数据来源:互联网公开数据 标签:人工智能,电子邮件,数据集,自然语言处理,文本生成,机器学习,文本分析,文本挖掘 数据概述: 该数据集包含由人工智能生成的电子邮件数据,记录了不同主题和场景下的电子邮件内容。主要特征如下:...
    packageimg
  • 增强版Fairseq模型训练数据集-arinaruck

    2025年4月24日   

    增强版Fairseq模型训练数据集-arinaruck 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,文本生成,数据集,深度学习,Fairseq,模型训练,人工智能 数据概述: 该数据集是用于训练和评估增强版Fairseq模型的文本数据集合,旨在提升模型在自然语言处理任务中的性能。主要特征如下: 时间跨度:...
    packageimg
  • 孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom

    2025年4月24日   

    孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,句子转换,数据集,文本生成,语言学,机器翻译,文本分析 数据概述: 该数据集包含孟加拉语的句子转换数据,记录了孟加拉语句子在不同语法结构和表达方式下的多种转换形式。主要特征如下:...
    packageimg
  • Mistral提示数据集MistralPromptDataset-isrswsiser

    2025年4月24日   

    Mistral提示数据集MistralPromptDataset-isrswsiser 数据来源:互联网公开数据 标签:自然语言处理,提示工程,数据集,机器学习,语言模型,文本生成,人工智能,深度学习 数据概述: 该数据集包含来自Mistral项目的提示数据,记录了用于训练和优化语言模型的提示样本。主要特征如下:...
    packageimg
  • 元学习语言模型数据集Meta-LLMsDataset-daqueen

    2025年4月24日   

    元学习语言模型数据集Meta-LLMsDataset-daqueen 数据来源:互联网公开数据 标签:语言模型,元学习,数据集,自然语言处理,机器学习,人工智能,深度学习,文本生成 数据概述:该数据集包含了来自多个来源的文本数据,用于训练和评估元学习语言模型。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2023年。...
    packageimg
  • YouTube视频摘要机器人数据集2022年-mykytafilipenko

    2025年4月24日   

    YouTube视频摘要机器人数据集2022年-mykytafilipenko 数据来源:互联网公开数据 标签:YouTube, 视频摘要, 数据集, 自然语言处理, 机器学习, 文本生成, 视频分析, 人工智能 数据概述: 该数据集包含来自YouTube视频摘要机器人的数据,记录了用户上传的视频及其对应的自动生成功能生成的摘要。主要特征如下:...
    packageimg
  • ChatGPT中文对话数据集ChatGPTChineseDialogueDataset-netuser01

    2025年4月24日   

    ChatGPT中文对话数据集ChatGPTChineseDialogueDataset-netuser01 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,文本生成,语言模型,数据挖掘 数据概述: 该数据集包含来自ChatGPT中文对话生成任务的数据,记录了中文自然语言对话的样本。主要特征如下:...
    packageimg
  • 新闻标题生成数据集NewsDatasetforHeadlineGeneration-rishikeshfulari

    2025年4月24日   

    新闻标题生成数据集NewsDatasetforHeadlineGeneration-rishikeshfulari 数据来源:互联网公开数据 标签:新闻,标题生成,数据集,自然语言处理,文本生成,机器学习,语言模型,数据挖掘 数据概述: 该数据集包含来自多个新闻来源的新闻文章及其对应的标题,旨在为新闻标题生成任务提供数据支持。主要特征如下:...
    packageimg
  • API测试用例生成数据集APITestCaseGenerationDataset-jacktorrance

    2025年4月24日   

    API测试用例生成数据集APITestCaseGenerationDataset-jacktorrance 数据来源:互联网公开数据 标签:API测试,测试用例,数据集,自然语言处理,机器学习,软件测试,文本生成,自动化测试 数据概述: 该数据集包含用于API测试用例生成的相关数据,记录了API接口的描述信息及其对应的测试用例。主要特征如下:...
    packageimg
  • AlpacaGPT4中文数据集AlpacaGPT4ChineseDataset-airzip

    2025年4月24日   

    AlpacaGPT4中文数据集AlpacaGPT4ChineseDataset-airzip 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,数据集,文本生成,机器学习,人工智能,机器翻译,智能对话 数据概述: 该数据集包含来自 Alpaca GPT4 项目的中文数据,记录了用于训练和优化大型语言模型的高质量文本数据。主要特征如下:...
    packageimg
  • 多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang

    2025年4月24日   

    多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,深度学习,语言模型,文本生成,人工智能 数据概述: 该数据集包含来自多种语言的数据,记录了用于机器翻译和语言模型训练的文本数据。主要特征如下:...
    packageimg