-
大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q
大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,文本生成,深度学习 数据概述: 该数据集包含大规模的文本数据,主要用于训练大型语言模型。主要特征如下:...
-
语言模型诗歌生成数据集-100首诗歌-2023年-imbikramsaha
语言模型诗歌生成数据集-100首诗歌-2023年-imbikramsaha 数据来源:互联网公开数据 标签:诗歌,语言模型,NLP,文本生成,机器学习,教育,学习资源 数据概述: 本数据集包含100首诗歌,适用于语言模型的文本生成任务。数据集中的诗歌涵盖了不同的风格和主题,包括抒情诗、叙事诗和自由诗等,为训练语言模型提供了丰富的文本素材。...
-
英语模板数据集EnglishTemplatedDataset-rnaveensrinivas
英语模板数据集EnglishTemplatedDataset-rnaveensrinivas 数据来源:互联网公开数据 标签:英语学习,文本分析,数据集,自然语言处理,语言模型,文本生成,语料库,写作辅助 数据概述: 该数据集包含来自各种来源的英语文本数据,旨在为英语学习和自然语言处理研究提供支持。主要特征如下:...
-
十大说唱歌手作品文本分析数据集-2023-ngxdtv
十大说唱歌手作品文本分析数据集-2023-ngxdtv 数据来源:互联网公开数据 标签:说唱音乐,文本分析,自然语言处理,机器学习,文本分类,情感分析,主题建模,文本生成,语言模型,语音识别 数据概述: 本数据集包含超过2600首由十个不同说唱歌手创作的作品文本,其中包括Ali As、Alligatoah、Kollegah和Kool...
-
印度孟加拉语自由诗歌数据集2021-truthr
印度孟加拉语自由诗歌数据集2021-truthr 数据来源:互联网公开数据 标签:孟加拉语,诗歌,数据集,免费资源,自然语言处理,文本生成,预训练模型,下游任务,CC-BY-SA 4.0 数据概述:...
-
互联网歌词文本数据集LyricsfromWebDataset-kevinree
互联网歌词文本数据集LyricsfromWebDataset-kevinree 数据来源:互联网公开数据 标签:歌词,文本分析,自然语言处理,音乐,数据集,情感分析,机器学习,中文 数据概述: 该数据集包含从互联网上抓取的歌词文本数据,涵盖了不同语言和风格的歌曲。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了从早期歌曲到现代音乐作品。...
-
孟加拉语指令数据集-多样化和高质量-shanto8
孟加拉语指令数据集-多样化和高质量-shanto8 数据来源:互联网公开数据 标签:孟加拉语,指令,自然语言处理,教育,翻译,语义理解,文本生成,文化传承,技术文档 数据概述:...
-
语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99
语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99 数据来源:互联网公开数据 标签:语言模型,文本生成,数据集,自然语言处理,机器学习,文本分析,语义理解,人工智能 数据概述: 该数据集包含用于语言模型训练和评估的文本数据,记录了多种文本的语义变换和生成任务。主要特征如下:...
-
生成式人工智能应用数据集GenerativeAIApplicationsDataset-niyamatalmass
生成式人工智能应用数据集GenerativeAIApplicationsDataset-niyamatalmass 数据来源:互联网公开数据 标签:人工智能,生成式AI,数据集,机器学习,自然语言处理,图像生成,文本生成,多模态学习...
-
全球GPT-1N外部模型评估数据集-sasrdw
全球GPT-1N外部模型评估数据集-sasrdw 数据来源:互联网公开数据 标签:自然语言处理,模型评估,GPT-1N,语言模型,数据集,文本生成,文本分析,人工智能,机器学习 数据概述: 该数据集包含了用于评估GPT-1N外部模型性能的各种测试数据,旨在全面衡量模型在不同任务上的表现。主要特征如下: 时间跨度:数据收集时间跨度不固定,持续更新。...
-
CLIP文本生成数据集主题-场景-对象-时间数据集CLIPTextGenerationDataset-anantjain1223
CLIP文本生成数据集主题-场景-对象-时间数据集CLIPTextGenerationDataset-anantjain1223 数据来源:互联网公开数据 标签:文本生成,数据集,机器学习,自然语言处理,计算机视觉,多模态学习,图像描述,AI技术...
-
图像描述生成数据集ImageDescriptionGenerationDataset-daneshwarisavadkar
图像描述生成数据集ImageDescriptionGenerationDataset-daneshwarisavadkar 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,深度学习,图像标注,人工智能,文本生成 数据概述: 该数据集包含图像及其对应的文本描述,旨在用于图像描述生成任务。主要特征如下:...
-
提示生成数据集PromptsGeneratedV2Dataset-andreivanenko
提示生成数据集PromptsGeneratedV2Dataset-andreivanenko 数据来源:互联网公开数据 标签:自然语言处理,提示生成,数据集,机器学习,文本生成,人工智能,语言模型,数据科学 数据概述: 该数据集包含来自Prompts Generated V2项目的提示生成数据,记录了用于训练和评估语言模型的提示文本。主要特征如下:...
-
人工智能生成文本竞赛合成数据集-sharathshebbar
人工智能生成文本竞赛合成数据集-sharathshebbar 数据来源:互联网公开数据 标签:人工智能,文本生成,数据集,自然语言处理,机器学习,文本分析,竞赛,模型评估 数据概述:该数据集包含为人工智能生成文本竞赛(AI-Generated Text...
-
杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh
杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,模型训练,BART,文本匹配,语言模型,人工智能 数据概述: 该数据集包含杰布·普罗姆特(JB...
-
出租女友女主角一之濑千鹤角色对话数据集-xandercubbin
出租女友女主角一之濑千鹤角色对话数据集-xandercubbin 数据来源:互联网公开数据 标签:动漫,角色,对话,文本,一之濑千鹤,出租女友,情感分析,自然语言处理 数据概述:...
-
DAIGT-qwen生成文本数据集-2023-zheyushen
DAIGT-qwen生成文本数据集-2023-zheyushen 数据来源:互联网公开数据 标签:DAIGT,qwen,文本生成,数据集,机器学习,深度学习,训练数据,文本处理 数据概述: 本数据集包含由DAIGT-...
-
英语名言收集与分析数据集-2023-usmanhaider123
英语名言收集与分析数据集-2023-usmanhaider123 数据来源:互联网公开数据 标签:英语名言,作者,标签,灵感,爱情,死亡,人工智能,学习资源 数据概述:...
-
端到端自然语言生成餐厅领域挑战数据集-2017-mexwell
端到端自然语言生成餐厅领域挑战数据集-2017-mexwell 数据来源:互联网公开数据 标签:自然语言生成,NLG,端到端,数据驱动,餐厅领域,挑战数据集,文本生成 数据概述:...
-
人工智能论文摘要风格转换数据集-prathapkashyap
人工智能论文摘要风格转换数据集-prathapkashyap 数据来源:互联网公开数据 标签:人工智能,论文摘要,风格转换,自然语言处理,平行语料库,GPT-4,文本生成,风格迁移 数据概述:...



