-
文本数据俄语语料库数据集TextDataRussianCorpus-kartushovdanil
文本数据俄语语料库数据集TextDataRussianCorpus-kartushovdanil 数据来源:互联网公开数据 标签:俄语文本, 语料库, 自然语言处理, 文本分析, 语言模型, 文本挖掘, 语义分析, 文本数据 数据概述: 该数据集包含俄语文本数据,记录了俄语文本的集合,主要用于自然语言处理任务。主要特征如下:... -
西班牙语LLaMA2模型对话语料数据集SpanishLLaMA2DialogueCorpus-rizwanrizwannazir
西班牙语LLaMA2模型对话语料数据集SpanishLLaMA2DialogueCorpus-rizwanrizwannazir 数据来源:互联网公开数据 标签:LLaMA2, 对话数据, 西班牙语, 自然语言处理, 文本生成, 语言模型, 机器翻译, 语料库 数据概述:... -
文本质量评估子任务预测数据集TextQualityAssessmentSubtaskPrediction-kunihikofurugori
文本质量评估子任务预测数据集TextQualityAssessmentSubtaskPrediction-kunihikofurugori 数据来源:互联网公开数据 标签:文本评估, 语言模型, 文本分析, 语法, 连贯性, 词汇, 风格, 机器学习 数据概述:... -
波斯古典诗歌文本生成数据集PersianClassicalPoetryTextGenerationDataset-minar61
波斯古典诗歌文本生成数据集PersianClassicalPoetryTextGenerationDataset-minar61 数据来源:互联网公开数据 标签:诗歌生成,文本生成,波斯语,自然语言处理,机器翻译,语言模型,古典文学,文本对 数据概述: 该数据集包含来自波斯古典诗歌作品的数据,记录了诗歌文本的提问与对应的回答。主要特征如下:... -
孟加拉语数学问题数据集BengaliMathProblemsDataset-aaniksahaa
孟加拉语数学问题数据集BengaliMathProblemsDataset-aaniksahaa 数据来源:互联网公开数据 标签:数学问题, 孟加拉语, 文本分析, 自然语言处理, 数学教育, 数据标注, 机器学习, 语言模型 数据概述: 该数据集包含用孟加拉语编写的数学问题,旨在为数学问题求解和自然语言处理任务提供训练数据。主要特征如下:... -
埃塞俄比亚社交媒体仇恨言论检测数据集EthiopianSocialMediaHateSpeechDetection-tigistwondimneh
埃塞俄比亚社交媒体仇恨言论检测数据集EthiopianSocialMediaHateSpeechDetection-tigistwondimneh 数据来源:互联网公开数据 标签:仇恨言论, 社交媒体, 文本分类, 阿姆哈拉语, 语料库, 情感分析, 自然语言处理, 语言模型 数据概述:... -
多项选择题干扰项生成数据集MultipleChoiceDistractorGeneration-capboy
多项选择题干扰项生成数据集MultipleChoiceDistractorGeneration-capboy 数据来源:互联网公开数据 标签:多项选择题, 干扰项, 文本生成, 教育, 自然语言处理, 考试, 语义分析, 语言模型 数据概述: 该数据集包含用于构建多项选择题干扰项的文本数据,记录了与给定问题相关的错误或不相关的选项。主要特征如下:... -
写作能力评估Prompt提示与文章数据集WritingSkillAssessmentPromptandEssaysDataset-muj76200
写作能力评估Prompt提示与文章数据集WritingSkillAssessmentPromptandEssaysDataset-muj76200 数据来源:互联网公开数据 标签:写作评估, 文本生成, 自然语言处理, 提示工程, 写作技巧, 论文写作, 教育, 语言模型 数据概述:... -
文本质量评估预测数据集TextQualityAssessmentPrediction-maxverstappen
文本质量评估预测数据集TextQualityAssessmentPrediction-maxverstappen 数据来源:互联网公开数据 标签:文本评估, 写作质量, 自然语言处理, 文本分析, 机器学习, 语言模型, 文本特征, 评分预测 数据概述:... -
印度语问答数据集HindiQuestionAnsweringDataset-aashitadutta
印度语问答数据集HindiQuestionAnsweringDataset-aashitadutta 数据来源:互联网公开数据 标签:机器阅读理解, 问答系统, 自然语言处理, 文本摘要, 印度语, 语料库, 文本匹配, 语言模型 数据概述: 该数据集包含来自公开数据源的印度语问答对,旨在促进机器阅读理解和问答系统的研究。主要特征如下:... -
吸血鬼Reiji对话数据集VampireReijiDialogueDataset-oasishusband
吸血鬼Reiji对话数据集VampireReijiDialogueDataset-oasishusband 数据来源:互联网公开数据 标签:对话数据, 角色扮演, 文本分析, 情感分析, 语言模型, 动漫, 游戏, 语料库 数据概述: 该数据集包含来自特定动漫或游戏作品中关于吸血鬼Reiji的角色对话记录。主要特征如下:... -
文本内容分析训练数据集TextContentAnalysisTrainingDataset-mohammedhamdan
文本内容分析训练数据集TextContentAnalysisTrainingDataset-mohammedhamdan 数据来源:互联网公开数据 标签:文本分析, 情感分析, 语言模型, 文本分类, 机器学习, 语料库, 文本生成, 自然语言处理 数据概述:... -
问答推理多选题数据集QuestionAnsweringMultiple-ChoiceDataset-dabangg987
问答推理多选题数据集QuestionAnsweringMultiple-ChoiceDataset-dabangg987 数据来源:互联网公开数据 标签:问答系统, 多选题, 文本推理, 自然语言处理, 机器阅读理解, 知识图谱, 数据标注, 语言模型 数据概述:... -
多语言机器翻译回译验证集MultilingualMachineTranslationBack-translatedValidationSet-antozaelgamd
多语言机器翻译回译验证集MultilingualMachineTranslationBack-translatedValidationSet-antozaelgamd 数据来源:互联网公开数据 标签:机器翻译, 回译, 文本摘要, 多语言, 文本校对, 语言模型, 数据增强, 验证集 数据概述:... -
文本可读性评估数据集TextReadabilityAssessmentDataset-zukkid
文本可读性评估数据集TextReadabilityAssessmentDataset-zukkid 数据来源:互联网公开数据 标签:文本分析, 可读性, 自然语言处理, 语言模型, 文本理解, 机器学习, 文本难度, 教育评估 数据概述: 该数据集包含来自CommonLit平台的文本数据,记录了用于评估文本可读性的文本片段。主要特征如下:... -
学生写作评估文本数据集StudentWritingEvaluationEssays-sycj427
学生写作评估文本数据集StudentWritingEvaluationEssays-sycj427 数据来源:互联网公开数据 标签:写作评估, 文本分析, 学生写作, 语言模型, 文本生成, 写作能力, 评估指标, 教育 数据概述: 该数据集包含来自公开平台的学生写作文本,记录了学生的作文内容,可用于评估写作能力、训练语言模型等任务。主要特征如下:... -
语音识别中文转写答案数据集SpeechRecognitionChineseTranscriptionAnswerDataset-lzu235
语音识别中文转写答案数据集SpeechRecognitionChineseTranscriptionAnswerDataset-lzu235 数据来源:互联网公开数据 标签:语音识别, 中文转写, 语音数据, 文本数据, 声学模型, 语言模型, 深度学习, 数据集 数据概述:... -
商品俄英翻译文本数据集ProductRussian-EnglishTranslation-kaparna
商品俄英翻译文本数据集ProductRussian-EnglishTranslation-kaparna 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 俄语, 英语, 商品描述, 语言模型, 自然语言处理, 多语言 数据概述:... -
孟加拉语命名实体识别训练数据集BengaliNamedEntityRecognitionTrainingDataset-aman12398
孟加拉语命名实体识别训练数据集BengaliNamedEntityRecognitionTrainingDataset-aman12398 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 孟加拉语, 文本标注, 序列标注, 语言模型, 机器翻译, 文本分析 数据概述:... -
孟加拉语文本数据集BanglaTextDataset-sameen53
孟加拉语文本数据集BanglaTextDataset-sameen53 数据来源:互联网公开数据 标签:孟加拉语, 文本数据, 自然语言处理, 语料库, 文本分析, 语言模型, 情感分析, 机器翻译 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种主题的孟加拉语文本片段。主要特征如下: 时间跨度:数据未标明具体时间,可视为静态文本语料。...