-
自然语言处理Prompt生成数据集NaturalLanguageProcessingPromptGeneration-musabumiar2004
自然语言处理Prompt生成数据集NaturalLanguageProcessingPromptGeneration-musabumiar2004 数据来源:互联网公开数据 标签:自然语言处理, Prompt工程, 文本生成, 提示词, 数据增强, 模型训练, 文本分析, 机器学习 数据概述:... -
乌尔都语GPT对话数据集-laibaasmatullah
乌尔都语GPT对话数据集-laibaasmatullah 数据来源:互联网公开数据 标签:自然语言处理,乌尔都语,对话,GPT,语言模型,文本生成,数据集,人工智能 数据概述:该数据集包含基于GPT模型的乌尔都语对话数据,记录了用户与模型之间的交互内容。主要特征如下: 时间跨度:数据记录的时间范围不固定,持续更新。... -
CodeBERT代码生成数据集CodeBERTCodeGenerationDataset-ducanger
CodeBERT代码生成数据集CodeBERTCodeGenerationDataset-ducanger 数据来源:互联网公开数据 标签:代码生成,自然语言处理,深度学习,代码理解,软件工程,数据集,编程,文本生成 数据概述: 该数据集包含由CodeBERT模型生成的代码数据,用于代码生成任务。主要特征如下:... -
人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii
人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii 数据来源:互联网公开数据 标签:人工智能, 文本生成, 角色扮演, 语言模型, 文本分析, 数据标注, 机器学习, 自然语言处理 数据概述:... -
优化下一句生成数据集OptimizeNext-ParaphraseDataDataset-napoler
优化下一句生成数据集OptimizeNext-ParaphraseDataDataset-napoler 数据来源:互联网公开数据 标签:自然语言处理,文本生成,机器学习,数据集,语言模型,序列到序列,文本重述,人工智能 数据概述:该数据集包含用于优化下一句生成和同义改写的文本数据,记录了成对的原始句子和优化后的改写句子。主要特征如下:... -
孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif
孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,语言模型,文本分析,机器翻译,文本生成 数据概述: 该数据集包含孟加拉语文本的摘要数据,记录了孟加拉语文章及其对应的摘要信息。主要特征如下:... -
指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban
指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban 数据来源:互联网公开数据 标签:文本生成, 指令微调, 多视角, 数据增强, 自然语言处理, 深度学习, Prompt工程, 数据集构建 数据概述:... -
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03 数据来源:互联网公开数据 标签:自然语言处理, 文本生成, 维基百科, GPT模型, 文本对比, 摘要生成, 语言模型, 数据集 数据概述:... -
写作质量评估与文本生成数据集WritingQualityAssessmentandTextGenerationDataset-laurensprast
写作质量评估与文本生成数据集WritingQualityAssessmentandTextGenerationDataset-laurensprast 数据来源:互联网公开数据 标签:文本生成, 写作评估, 自然语言处理, 机器学习, 文本分类, 语料分析, 情感分析, 写作技巧 数据概述:... -
开放助手对话数据集OASST1-SL-valterh
开放助手对话数据集OASST1-SL-valterh 数据来源:互联网公开数据 标签:对话数据,自然语言处理,机器学习,情感分析,文本生成,对话系统,开源,多语言 数据概述: 该数据集包含来自开放助手(Open Assistant)项目的对话数据,主要记录了用户与AI助手的多轮对话内容。主要特征如下:... -
新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064
新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064 数据来源:互联网公开数据 标签:文本摘要, 新闻摘要, 自然语言处理, 文本生成, 机器翻译, 深度学习, 语料库, 摘要模型 数据概述:... -
文本转述数据集TextParaphrasingDataset-soumyasangamjha
文本转述数据集TextParaphrasingDataset-soumyasangamjha 数据来源:互联网公开数据 标签:文本转述, 自然语言处理, 机器翻译, 文本生成, 语义理解, 数据增强, 深度学习, 语料库 数据概述: 该数据集包含来自多个来源的文本转述对,记录了原始文本及其对应的转述版本,旨在用于训练和评估文本转述模型。主要特征如下:... -
文本转SQL语句生成数据集Text-to-SQLGenerationDataset-minhnguyendichnhat
文本转SQL语句生成数据集Text-to-SQLGenerationDataset-minhnguyendichnhat 数据来源:互联网公开数据 标签:自然语言处理, 文本生成, SQL, 数据库, 语义解析, 数据集, 机器学习, 代码生成 数据概述: 该数据集包含文本描述与对应的SQL查询语句,用于训练和评估文本到SQL(Text-to-... -
图像描述生成数据集ImageCaptioningDataset-zainpirzada68
图像描述生成数据集ImageCaptioningDataset-zainpirzada68 数据来源:互联网公开数据 标签:图像描述, 计算机视觉, 自然语言处理, 图像标注, 深度学习, 图像识别, 数据集, 文本生成 数据概述: 该数据集包含图像文件及其对应的文字描述,用于训练和评估图像描述生成模型。主要特征如下:... -
俄语新闻摘要生成数据集RussianNewsSummarizationDataset-anatoliypan
俄语新闻摘要生成数据集RussianNewsSummarizationDataset-anatoliypan 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 俄语, 新闻分析, 机器翻译, 深度学习, 文本生成, 语料库 数据概述: 该数据集包含来自新闻文章的数据,记录了俄语新闻文章的标题、原文文本及其生成的摘要。主要特征如下:... -
文本生成与真伪识别平衡数据集TextGeneration-AuthenticityBalancedDataset-nju123
文本生成与真伪识别平衡数据集TextGeneration-AuthenticityBalancedDataset-nju123 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 文本分类, 真伪辨别, 数据平衡, 机器写作, 语料分析, 深度学习 数据概述: 该数据集包含来自文本生成任务的数据,记录了文本内容及其生成状态。主要特征如下:... -
写作评估与生成文本分析数据集WritingEvaluation-GeneratedTextAnalysisDataset-conjuring92
写作评估与生成文本分析数据集WritingEvaluation-GeneratedTextAnalysisDataset-conjuring92 数据来源:互联网公开数据 标签:文本生成, 写作评估, 自然语言处理, 机器学习, 文本分析, 创作质量, 论文写作, 语料库 数据概述:... -
人工智能生成文本对比人类文本清洗数据集-dillonwongso
人工智能生成文本对比人类文本清洗数据集-dillonwongso 数据来源:互联网公开数据 标签:人工智能,文本生成,文本清洗,数据集,自然语言处理,机器学习,文本分析,对比研究 数据概述: 该数据集包含来自不同来源的人工智能生成文本和人类编写的文本,并经过清洗处理,旨在用于比较分析。主要特征如下:... -
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,文本生成,深度学习,人工智能,多语言支持 数据概述: 该数据集包含来自多个来源的大规模文本数据,用于扩充和训练大规模语言模型。主要特征如下:... -
图像描述生成数据集ImageCaptionsDataset-sandhyas29
图像描述生成数据集ImageCaptionsDataset-sandhyas29 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,深度学习,图像识别,文本生成,人工智能 数据概述: 该数据集包含图像及其对应的文字描述,旨在用于训练图像描述生成模型。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时期和场景的图像。...