-
文本生成指令数据集TextGenerationInstructions-dmitriyab
文本生成指令数据集TextGenerationInstructions-dmitriyab 数据来源:互联网公开数据 标签:文本生成, 指令, 自然语言处理, 文本转换, 语言模型, 数据集, 创作, 语料库 数据概述: 该数据集包含用于文本生成的指令示例,记录了不同类型的文本生成任务。主要特征如下:... -
大模型评估指标对比分析数据集LargeLanguageModelEvaluationMetricsComparison-gyanbardhan
大模型评估指标对比分析数据集LargeLanguageModelEvaluationMetricsComparison-gyanbardhan 数据来源:互联网公开数据 标签:大模型, 语言模型, 评估, 指标, BLEU, ROUGE_L, 语义相似度, 对比分析 数据概述:... -
马达加斯加语词性标注数据集MalagasyPart-of-SpeechTaggingDataset-vatosoarazafi
马达加斯加语词性标注数据集MalagasyPart-of-SpeechTaggingDataset-vatosoarazafi 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 马达加斯加语, 语言学, 文本分析, 语料库, 机器学习, 语言模型 数据概述: 该数据集包含马达加斯加语的词性标注数据,记录了单词及其对应的词性标签。主要特征如下:... -
俄语问答与知识学习数据集RussianQuestionAnsweringandKnowledgeLearningDataset-mon1k2
俄语问答与知识学习数据集RussianQuestionAnsweringandKnowledgeLearningDataset-mon1k2 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 俄语, 语言模型, 知识库, 文本理解, 机器阅读, 教育 数据概述:... -
英语-乌尔都语翻译数据集English-UrduTranslationDataset-cygnusanubis
英语-乌尔都语翻译数据集English-UrduTranslationDataset-cygnusanubis 数据来源:互联网公开数据 标签:机器翻译, 语言模型, 文本翻译, 英语, 乌尔都语, 自然语言处理, 双语对照, 语料库 数据概述: 该数据集包含英语和乌尔都语的翻译对,记录了英语句子及其对应的乌尔都语翻译。主要特征如下:... -
阿姆哈拉语情感分析文本数据集AmharicSentimentAnalysisTextDataset-tigistwondimneh
阿姆哈拉语情感分析文本数据集AmharicSentimentAnalysisTextDataset-tigistwondimneh 数据来源:互联网公开数据 标签:情感分析, 阿姆哈拉语, 文本分类, 情感极性, 语言模型, 机器学习, 自然语言处理, 数据标注 数据概述:... -
泰语问答开发数据集ThaiQuestionAnsweringDevelopmentDataset-isamansangbumrung
泰语问答开发数据集ThaiQuestionAnsweringDevelopmentDataset-isamansangbumrung 数据来源:互联网公开数据 标签:问答系统, 泰语, NLP, 文本理解, 信息检索, 机器阅读, 数据标注, 语言模型 数据概述: 该数据集包含来自公开来源的泰语问答数据,旨在用于开发和评估泰语问答系统。主要特征如下:... -
波斯语文本情感分析数据集PersianTextSentimentAnalysisDataset-anila1191399
波斯语文本情感分析数据集PersianTextSentimentAnalysisDataset-anila1191399 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 波斯语, 文本分类, 情绪识别, 机器学习, 语料库, 语言模型 数据概述: 该数据集包含波斯语文本数据,用于情感分析任务。主要特征如下:... -
哈萨克语新闻文章数据集
哈萨克语新闻文章数据集 数据来源:互联网公开数据 标签:哈萨克语,新闻,文本分类,情感分析,命名实体识别,多语言处理,语言模型 数据概述: 本数据集收录了从Tengri... -
语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500
语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,语言模型,机器学习,人工智能,机器翻译,对话系统 数据概述: 该数据集包含来自Alpaca和FLAN语言模型的生成文本数据,记录了语言模型在多种任务中的文本生成结果。主要特征如下:... -
大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks
大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,微调,文本生成,机器翻译,问答系统,深度学习 数据概述: 该数据集包含用于微调大规模语言模型的数据,涵盖了多种自然语言处理任务。主要特征如下:... -
机器翻译模型数据集TranslationModelDataset-osamaabobakr
机器翻译模型数据集TranslationModelDataset-osamaabobakr 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言模型,深度学习,人工智能,文本分析,多语言翻译 数据概述: 该数据集包含来自多个来源的多语言文本数据,用于训练和评估机器翻译模型。主要特征如下:... -
新闻微调量化ChatGLM2数据集NewsFine-TuneQuantineChatGLM2Dataset-lollipopshen
新闻微调量化ChatGLM2数据集NewsFine-TuneQuantineChatGLM2Dataset-lollipopshen 数据来源:互联网公开数据 标签:新闻数据,微调数据集,量化模型,自然语言处理,机器学习,文本分析,AI助手,语言模型 数据概述:... -
Quora语句改写数据集QuoraParaphrasingDataset-fbgame123
Quora语句改写数据集QuoraParaphrasingDataset-fbgame123 数据来源:互联网公开数据 标签:自然语言处理,文本改写,数据集,机器学习,语义相似度,语言模型,文本生成,人工智能 数据概述: 该数据集来源于Quora平台,包含了用户提问的原始语句及对应的改写版本,用于研究语句改写和语义相似度分析。主要特征如下:... -
核心ference数据集CoreferenceDataset-mrdbc29
核心ference数据集CoreferenceDataset-mrdbc29 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语言模型,句法分析,语义理解,人工智能 数据概述: 该数据集包含来自多个自然语言处理研究项目的文本数据,记录了文本中的核心ference现象。主要特征如下:... -
日常对话数据集DailyDialogCleanDataset-va6573
日常对话数据集DailyDialogCleanDataset-va6573 数据来源:互联网公开数据 标签:对话数据,自然语言处理,数据集,情感分析,文本分类,机器学习,语言模型,人机交互 数据概述: 该数据集包含来自日常对话的文本数据,记录了不同场景下的对话内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为日常对话的文本记录。... -
自然语言处理任务数据集NLPAssignment4Dataset-onkarsawant5613
自然语言处理任务数据集NLPAssignment4Dataset-onkarsawant5613 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器翻译,情感分析,文本分类,深度学习,语言模型 数据概述:该数据集包含用于自然语言处理任务的文本数据,涵盖了多种语言和任务类型。主要特征如下:... -
乌尔都语诗歌解析数据集UrduPoetryExplanationDataset-thee5z
乌尔都语诗歌解析数据集UrduPoetryExplanationDataset-thee5z 数据来源:互联网公开数据 标签:乌尔都语,诗歌,数据集,文学研究,自然语言处理,文化研究,语言模型,文本分析 数据概述: 该数据集包含来自乌尔都语诗歌的文本数据,记录了乌尔都语诗歌及其对应的解释和解析。主要特征如下:... -
在线书籍完整版数据集LibrosCompletosDataset-hykevin2
在线书籍完整版数据集LibrosCompletosDataset-hykevin2 数据来源:互联网公开数据 标签:书籍,数据集,文本分析,自然语言处理,文学研究,西班牙语,内容挖掘,语言模型 数据概述: 该数据集包含来自互联网的西班牙语在线书籍完整版数据,涵盖了各种主题和文学体裁。主要特征如下:... -
测试MisralLLaMA与ChatGPT差异数据集TestMisralLLaMAChatGPTDifferSet-alexeyj
测试MisralLLaMA与ChatGPT差异数据集TestMisralLLaMAChatGPTDifferSet-alexeyj 数据来源:互联网公开数据 标签:对话系统,语言模型,数据集,自然语言处理,机器学习,人工智能,文本生成,比较分析 数据概述: 该数据集包含了Misral...