-
阿拉伯语文本摘要数据集ArabicTextSummarizationDataset-fadyelkbeer
阿拉伯语文本摘要数据集ArabicTextSummarizationDataset-fadyelkbeer 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,阿拉伯语,深度学习,数据集,机器翻译,语言模型,NLP 数据概述: 该数据集包含大量阿拉伯语文本及其对应的摘要,旨在用于阿拉伯语文本摘要任务的研究与开发。主要特征如下:... -
Llama1模型生成第一步数据集Generation1Step1Dataset-thaonguen
Llama1模型生成第一步数据集Generation1Step1Dataset-thaonguen 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,机器学习,Llama,Transformer,语言模型,预训练 数据概述: 该数据集包含用于 Llama 1 模型第一步训练的数据,主要用于构建基础的语言模型。主要特征如下:... -
大型语言模型生成器数据集LLMS生成器数据集-ranimmhisham
大型语言模型生成器数据集LLMS生成器数据集-ranimmhisham 数据来源:互联网公开数据 标签:语言模型,生成器,数据集,自然语言处理,机器学习,文本生成,人工智能,深度学习 数据概述:该数据集包含来自多个来源的文本数据,用于训练大型语言模型生成器,记录了各种类型的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
自然语言处理作业2-3数据集NLPAssignment2-3Dataset-dheerajkr1a1a
自然语言处理作业2-3数据集NLPAssignment2-3Dataset-dheerajkr1a1a 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,情感分析,语言模型,学术资源,文本分类 数据概述: 该数据集来自自然语言处理课程作业2-3,记录了用于文本分类和情感分析任务的文本数据。主要特征如下:... -
语言模型与人工智能生成数据集LLMAI-GeneratedDataset-jeremiahobeng
语言模型与人工智能生成数据集LLMAI-GeneratedDataset-jeremiahobeng 数据来源:互联网公开数据 标签:人工智能,语言模型,数据生成,自然语言处理,机器学习,数据集,文本分析,智能生成 数据概述: 该数据集包含由语言模型和人工智能技术生成的文本数据,记录了通过先进AI模型生成的各种类型文本内容。主要特征如下:... -
BERT基础模型未分大小写文本处理数据集BERT-base-uncased-fresh-ep1Dataset-blackitten13
BERT基础模型未分大小写文本处理数据集BERT-base-uncased-fresh-ep1Dataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,深度学习,BERT模型,语言模型,数据集,AI应用 数据概述:... -
自然语言处理生成答案数据集NIRGeneratedAnswersDataset-mrsimple07
自然语言处理生成答案数据集NIRGeneratedAnswersDataset-mrsimple07 数据来源:互联网公开数据 标签:自然语言处理,生成答案,数据集,机器学习,文本分析,人工智能,信息检索,语言模型 数据概述: 该数据集包含由自然语言处理技术生成的答案,适用于对话系统,问答系统等任务。主要特征如下:... -
预训练BERT基础模型数据集BERT-base-casedPretrainedDataset-blackitten13
预训练BERT基础模型数据集BERT-base-casedPretrainedDataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,BERT,文本分析,深度学习,语言模型,数据集,NLP 数据概述: 该数据集包含了预训练的BERT-base-... -
语言模型与视觉识别技术评测数据集LLaVA-EN-TRDataset-fatihemirguler
语言模型与视觉识别技术评测数据集LLaVA-EN-TRDataset-fatihemirguler 数据来源:互联网公开数据 标签:语言模型,视觉识别,数据集,多模态,机器学习,自然语言处理,人工智能,评测数据 数据概述: 该数据集包含来自语言模型与视觉识别技术评测项目的数据,记录了多模态场景下的图像与文本配对信息。主要特征如下:... -
大型语言模型检测结果数据集LLMDetectionResultDataset-umgeeyo
大型语言模型检测结果数据集LLMDetectionResultDataset-umgeeyo 数据来源:互联网公开数据 标签:语言模型,数据集,机器学习,自然语言处理,模型评估,人工智能,模型检测,技术评估 数据概述: 该数据集包含来自大型语言模型(LLM)的检测结果,记录了模型在自然语言处理任务中的表现和评估数据。主要特征如下:... -
中文翻译数据集SQUADTranslatedtoHindiDataset-ramisaalam
中文翻译数据集SQUADTranslatedtoHindiDataset-ramisaalam 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言模型,文本分类,人工智能,中文翻译,Hindi 数据概述: 该数据集包含来自SQUAD数据集的中文翻译数据,记录了原始英文问答对及其对应的中文翻译。主要特征如下:... -
英语聊天机器人对话数据集EnglishChatbotDialogueDataset-nezahatkk
英语聊天机器人对话数据集EnglishChatbotDialogueDataset-nezahatkk 数据来源:互联网公开数据 标签:聊天机器人,对话数据,自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能 数据概述: 该数据集包含了英语聊天机器人生成的对话数据,记录了用户与聊天机器人之间的交互内容。主要特征如下:... -
大型语言模型对齐与偏好学习数据集LLMSYSPairPreferenceModelLlama3-8bDataset-letemoin
大型语言模型对齐与偏好学习数据集LLMSYSPairPreferenceModelLlama3-8bDataset-letemoin 数据来源:互联网公开数据 标签:人工智能,自然语言处理,机器学习,数据集,语言模型,偏好学习,模型对齐,深度学习 数据概述:... -
大型语言模型性能评测数据集MegformerMainDataset-sinamoradi
大型语言模型性能评测数据集MegformerMainDataset-sinamoradi 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,模型评测,机器学习,深度学习,AI评估,技术优化 数据概述: 该数据集包含来自Megformer项目的测试数据,专门用于评估大型语言模型的性能。主要特征如下:... -
GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr
GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,深度学习,文本分析 数据概述:该数据集包含了由GPT4再生成的语言模型数据,适用于自然语言处理,文本生成等任务。主要特征如下:... -
通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi
通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,教育技术 数据概述:该数据集包含用于文本摘要生成任务的通用测试数据,记录了多个文本及其对应的摘要信息。主要特征如下:... -
文本生成预测数据集NextWordGenerateDataset-anirudhasutar
文本生成预测数据集NextWordGenerateDataset-anirudhasutar 数据来源:互联网公开数据 标签:文本生成,数据集,自然语言处理,机器学习,人工智能,语言模型,文本预测,深度学习 数据概述:该数据集包含用于文本生成预测的数据,记录了大量文本数据以训练和评估语言模型。主要特征如下:... -
双子星长文本数据集GeminiLongContextDataset-akinduhiman
双子星长文本数据集GeminiLongContextDataset-akinduhiman 数据来源:互联网公开数据 标签:自然语言处理,长文本分析,数据集,机器学习,文本生成,语言模型,学术研究,人工智能 数据概述:该数据集包含来自双子星项目的长文本数据,记录了多种类型的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun
数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun 数据来源:互联网公开数据 标签:自然语言处理,数据集,分词器,文本处理,机器学习,语言模型,数据预处理,工具集 数据概述: 该数据集包含用于自然语言处理的多种工具和数据集,主要支持文本分词,数据预处理等任务。主要特征如下:... -
基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg
基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg 数据来源:互联网公开数据 标签:文本释义,机器翻译,数据集,自然语言处理,语义分析,多语言,语言模型,深度学习 数据概述: 该数据集包含了通过机器翻译生成的文本释义数据,主要用于训练和评估文本释义模型。主要特征如下: 时间跨度:...