-
多语言文本改写与翻译数据集MultilingualTextRewritingandTranslationDataset-yinjiashu
多语言文本改写与翻译数据集MultilingualTextRewritingandTranslationDataset-yinjiashu 数据来源:互联网公开数据 标签:文本改写, 机器翻译, 多语言, 语言模型, 文本生成, 自然语言处理, 文本校对, 语言学习 数据概述:... -
印度地区印地语语音转录测试数据集IndianHindiSpeechTranscriptionTestDataset-theakash04
印度地区印地语语音转录测试数据集IndianHindiSpeechTranscriptionTestDataset-theakash04 数据来源:互联网公开数据 标签:语音识别, 印地语, 语音转录, 声学模型, 语言模型, 语音数据集, 印度, 语音处理 数据概述:... -
孟加拉语神经机器翻译训练数据集BanglaNeuralMachineTranslationTrainingData-rakibullah
孟加拉语神经机器翻译训练数据集BanglaNeuralMachineTranslationTrainingData-rakibullah 数据来源:互联网公开数据 标签:机器翻译, 孟加拉语, 自然语言处理, 文本数据, 训练集, 文本对齐, 神经网络, 语言模型 数据概述:... -
波斯语医学问答数据集PersianMedicalQuestionAnsweringDataset-yeganehmohammadi
波斯语医学问答数据集PersianMedicalQuestionAnsweringDataset-yeganehmohammadi 数据来源:互联网公开数据 标签:医学问答, 波斯语, 自然语言处理, 问答系统, 医疗对话, 文本分析, 数据集, 语言模型 数据概述:... -
人工智能生成文章写作质量评估数据集AI-GeneratedEssayWritingQualityEvaluationDataset-wu468ef
人工智能生成文章写作质量评估数据集AI-GeneratedEssayWritingQualityEvaluationDataset-wu468ef 数据来源:互联网公开数据 标签:人工智能, 文本生成, 写作评估, 语言模型, 文本分析, 机器学习, 语料库, 写作质量 数据概述:... -
英语写作质量评估数据集EnglishWritingQualityEvaluation-williamalabi
英语写作质量评估数据集EnglishWritingQualityEvaluation-williamalabi 数据来源:互联网公开数据 标签:文本分析, 写作评估, 语言模型, 自然语言处理, 语法, 连贯性, 词汇, 风格, 机器学习 数据概述:... -
文本可读性分析数据集TextReadabilityAnalysisDataset-maunish
文本可读性分析数据集TextReadabilityAnalysisDataset-maunish 数据来源:互联网公开数据 标签:文本分析, 可读性, 自然语言处理, 语料库, 文本理解, 语言模型, 教育, 写作 数据概述: 该数据集包含来自互联网的文本数据,记录了文本内容及其可读性评估结果。主要特征如下:... -
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash 数据来源:互联网公开数据 标签:泰米尔语, 机器翻译, 文本翻译, 语言模型, 自然语言处理, 数据集构建, 语言学, 语料库 数据概述: 该数据集包含泰米尔语文本及其对应的翻译,旨在用于训练和评估机器翻译模型。主要特征如下:... -
土耳其语问答数据集TurkishQuestionAnsweringDataset-mehmetberatersari
土耳其语问答数据集TurkishQuestionAnsweringDataset-mehmetberatersari 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 土耳其语, 机器阅读, 信息检索, 语言模型, 知识问答 数据概述:... -
英语写作质量评估GPT生成文本数据集EnglishWritingQualityAssessmentGPTGeneratedTextDataset-jay12332
英语写作质量评估GPT生成文本数据集EnglishWritingQualityAssessmentGPTGeneratedTextDataset-jay12332 数据来源:互联网公开数据 标签: 英语写作, 文本生成, 语言模型, 文本评估, 写作质量, GPT, 教育, 机器学习 数据概述:... -
印地语语音转录数据集HindiSpeechTranscriptionDataset-manan27jn
印地语语音转录数据集HindiSpeechTranscriptionDataset-manan27jn 数据来源:互联网公开数据 标签:语音识别, 自然语言处理, 文本转录, 印地语, 语音数据, 语言模型, 数据集构建, 声学模型 数据概述: 该数据集包含来自公开渠道的印地语语音转录数据,旨在用于语音识别和自然语言处理任务。主要特征如下:... -
自然语言处理停用词与词汇列表数据集NaturalLanguageProcessingStopwordsandWordlists-nathanh4903
自然语言处理停用词与词汇列表数据集NaturalLanguageProcessingStopwordsandWordlists-nathanh4903 数据来源:互联网公开数据 标签:停用词, 词汇列表, 自然语言处理, 文本分析, 语料库, 文本预处理, 词汇统计, 语言模型 数据概述:... -
偏见生成文本分析数据集Bias-GeneratedTextAnalysis-adityayayaya
偏见生成文本分析数据集Bias-GeneratedTextAnalysis-adityayayaya 数据来源:互联网公开数据 标签:文本生成, 偏见分析, 语言模型, 负面情绪, 文本分类, 机器学习, 伦理研究, 语料库 数据概述: 该数据集包含来自GPT-Neo语言模型生成的文本,记录了模型在不同偏见提示下的输出结果。主要特征如下:... -
波斯语命名实体识别数据集PersianNamedEntityRecognitionDataset-yaserfathihour
波斯语命名实体识别数据集PersianNamedEntityRecognitionDataset-yaserfathihour 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 波斯语, 文本标注, 机器学习, 语料库, 语言模型, 文本分析 数据概述:... -
对话问答数据集ConversationQuestion-AnswerDataset-houzeker
对话问答数据集ConversationQuestion-AnswerDataset-houzeker 数据来源:互联网公开数据 标签:对话, 问答, 文本数据, 自然语言处理, 语义理解, 语言模型, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的对话问答数据,记录了对话的提问与回答内容,适用于训练和评估对话系统、问答系统等。主要特征如下:... -
教育领域在线学习文本数据集EducationOnlineLearningTextDataset-dhrubajyotiguha15
教育领域在线学习文本数据集EducationOnlineLearningTextDataset-dhrubajyotiguha15 数据来源:互联网公开数据 标签:在线学习, 教育, 文本分析, 写作评估, 语言模型, 文本生成, 写作质量, 数据集 数据概述: 该数据集包含来自教育领域的文本数据,记录了学生关于在线学习主题的写作内容。主要特征如下:... -
俄英双语翻译句子对数据集Russian-EnglishSentencePairs-ligtfeather
俄英双语翻译句子对数据集Russian-EnglishSentencePairs-ligtfeather 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 文本对齐, 自然语言处理, 语言模型, 双语语料库, 语料库构建 数据概述: 该数据集包含俄语和英语的句子对,旨在用于机器翻译模型的训练和评估。主要特征如下:... -
文本摘要与风格分析数据集TextSummarizationandStyleAnalysisDataset-daominhkhanh
文本摘要与风格分析数据集TextSummarizationandStyleAnalysisDataset-daominhkhanh 数据来源:互联网公开数据 标签:文本摘要, 风格分析, 文本处理, 自然语言处理, 语言模型, 机器翻译, 文本分类, 数据集 数据概述:... -
日语分词器词汇表数据集JapaneseTokenizerVocabulary-watarukitagawa
日语分词器词汇表数据集JapaneseTokenizerVocabulary-watarukitagawa 数据来源:互联网公开数据 标签:日语分词, 词汇表, 文本处理, 自然语言处理, 词汇分析, 语言模型, 数据集, 词语ID 数据概述: 该数据集包含用于日语文本分词的词汇表数据,记录了日语单词及其对应的Token-ID。主要特征如下:... -
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337 数据来源:互联网公开数据 标签:词频统计, 语言学, 语料库, 自然语言处理, 词汇分析, 文本数据, 语言模型, 英语 数据概述:...