-
英特尔神经聊天AI文本数据集IntelNeuralChatAITextDataDataset-iharshmgoyal
英特尔神经聊天AI文本数据集IntelNeuralChatAITextDataDataset-iharshmgoyal 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,文本生成,机器学习,语言模型,数据挖掘,文本分析 数据概述: 该数据集由英特尔公司提供,包含用于训练和评估神经聊天AI模型的文本数据。主要特征如下:... -
文本可读性分析数据集Readability-FoldsDataset-abhishek
文本可读性分析数据集Readability-FoldsDataset-abhishek 数据来源:互联网公开数据 标签:自然语言处理,文本分析,可读性评估,机器学习,教育技术,数据集,文本处理,语言模型 数据概述: 该数据集专注于文本可读性分析,记录了不同文本样本的可读性特征和评分。主要特征如下:... -
问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk
问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语义理解,语言模型,教育技术,数据挖掘 数据概述: 该数据集包含来自多个来源的问题重述和表达优化数据,记录了不同领域问题的原始表述及其优化后的重述。主要特征如下:... -
讽刺检测数据集SarcasticDetectionsDataset-muhammadabbasshareef
讽刺检测数据集SarcasticDetectionsDataset-muhammadabbasshareef 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,情感识别,人工智能,语言模型 数据概述: 该数据集包含来自社交媒体,新闻评论和论坛等公开来源的文本数据,记录了用户生成内容中的讽刺表达。主要特征如下:... -
自然语言处理数据集ANLP概览-ankitmakhija98
自然语言处理数据集ANLP概览-ankitmakhija98 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,NLP,语料库,语言模型,人工智能 数据概述: 该数据集汇总了各种自然语言处理(NLP)数据集,涵盖了文本分类,情感分析,机器翻译,文本生成,问答系统等多种NLP任务。主要特征如下: 时间跨度:... -
基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873
基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,语言模型,人工智能,文本生成,情感分析 数据概述: 该数据集由基因模型优化项目提供,主要记录了微型聊天机器人在不同对话场景下的交互数据。主要特征如下:... -
英语到乌尔都语翻译数据集EnglishtoUrduTranslationDataset-younismir
英语到乌尔都语翻译数据集EnglishtoUrduTranslationDataset-younismir 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,乌尔都语,英语,文本翻译,多语言 数据概述: 该数据集包含来自多个公开来源的英语到乌尔都语的平行语料,记录了双语句子对。主要特征如下:... -
多语言定制数据集MultilingualCustomDataset-amarendradeo
多语言定制数据集MultilingualCustomDataset-amarendradeo 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分析,语言模型,文本语料库,跨语言 数据概述: 该数据集包含多种语言的文本数据,旨在支持多语言处理任务,特别是机器翻译和语言模型训练。主要特征如下:... -
波斯语与英语翻译测试数据集-nouriehmadanian
波斯语与英语翻译测试数据集-nouriehmadanian 数据来源:互联网公开数据 标签:机器翻译,波斯语,英语,数据集,自然语言处理,语言模型,翻译质量评估,文本分析 数据概述: 该数据集包含波斯语到英语的翻译对,用于评估和训练机器翻译模型。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时间段的文本。... -
大型语言模型科学考试与推理过程数据集LLMScienceExamandRationaleDataset-serjhenrique
大型语言模型科学考试与推理过程数据集LLMScienceExamandRationaleDataset-serjhenrique 数据来源:互联网公开数据 标签:人工智能,语言模型,科学考试,推理过程,数据集,机器学习,教育技术,自然语言处理 数据概述:... -
高质量提示词数据集PolishedPromptsDataset-dmitriyab
高质量提示词数据集PolishedPromptsDataset-dmitriyab 数据来源:互联网公开数据 标签:自然语言处理,提示词工程,数据集,机器学习,文本生成,人工智能,语言模型,提示优化 数据概述: 该数据集包含经过精心设计和优化的提示词(prompts),用于自然语言处理任务,特别是大语言模型的文本生成。主要特征如下:... -
自然语言处理与开放域问答数据集NLPOpen-DomainQuestionAnsweringDataset-zepedaerik
自然语言处理与开放域问答数据集NLPOpen-DomainQuestionAnsweringDataset-zepedaerik 数据来源:互联网公开数据 标签:自然语言处理,开放域问答,数据集,文本理解,机器学习,信息检索,人工智能,语言模型 数据概述: 该数据集包含来自开放域问答任务的数据,记录了用户提出的问题及对应的答案。主要特征如下:... -
句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513
句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器学习,语义分析,语言模型,NLP,数据集,语义相似度 数据概述:该数据集包含来自PAWS项目(Paraphrase Adversarial... -
Python自然语言处理实践数据集-ndrianahani
Python自然语言处理实践数据集-ndrianahani 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分析,数据集,Python,机器学习,语言模型,文本挖掘 数据概述: 该数据集包含用于Python自然语言处理实践的文本数据,涵盖了多种NLP任务和应用场景。主要特征如下: 时间跨度: 数据记录的时间范围不限,数据集内容持续更新。... -
测试训练上下文大型语言模型数据集-quctngngvng
测试训练上下文大型语言模型数据集-quctngngvng 数据来源:互联网公开数据 标签:大型语言模型,数据集,自然语言处理,文本生成,机器学习,模型训练,语言模型,上下文学习 数据概述: 该数据集包含用于训练和评估大型语言模型(LLM)的文本数据,专注于测试训练(Test-Train)场景下的上下文学习能力。主要特征如下: 时间跨度:... -
数据科学问答LLM微调数据集DataScienceQ-ALLMFine-TuningDataset-divyangmandal
数据科学问答LLM微调数据集DataScienceQ-ALLMFine-TuningDataset-divyangmandal 数据来源:互联网公开数据 标签:数据科学,问答系统,微调,机器学习,自然语言处理,数据集,人工智能,语言模型... -
大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57
大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57 数据来源:互联网公开数据 标签:自然语言处理,文本生成,文本校对,数据集,机器翻译,语言模型,文本纠错,人工智能 数据概述: 该数据集基于 Google 的大型语言模型 T5,记录了大规模文本生成和校对的数据。主要特征如下:... -
自然语言推理数据集MNLI数据集-nlgluong
自然语言推理数据集MNLI数据集-nlgluong 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,文本分析,推理,语言模型,学术研究,深度学习 数据概述: 该数据集包含来自多领域来源的语料库,主要用于自然语言推理任务的研究。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2018年。... -
维基百科句子数据集WikiSentencesDataset-sgedela
维基百科句子数据集WikiSentencesDataset-sgedela 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,句子,语言模型,文本分析,机器学习,语料库 数据概述:该数据集包含来自维基百科的句子数据,旨在为自然语言处理任务提供高质量的文本语料库。主要特征如下:... -
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,机器学习,模型评估,语言模型,Llama 70B, Falcon 180B,文本检测,DAIGT,对抗样本 数据概述:...