-
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo 数据来源:互联网公开数据 标签:论文翻译,韩国留学,数据集,机器翻译,自然语言处理,语言学,文本分析,韩语 数据概述: 该数据集包含韩国留学申请相关的论文翻译数据,旨在促进机器翻译和语言学习研究。主要特征如下:... -
CommonLit2023开放式文本阅读理解数据集-lftuwujie
CommonLit2023开放式文本阅读理解数据集-lftuwujie 数据来源:互联网公开数据 标签:阅读理解,文本分析,自然语言处理,教育,数据集,机器学习,文本挖掘,语言学 数据概述: 该数据集由CommonLit平台提供,包含了来自不同年级学生的开放式文本阅读理解数据,旨在促进对阅读理解和文本分析的研究。主要特征如下:... -
多语言翻译语料库MultilingualTranslationCorpus-pushpaksaraf
多语言翻译语料库MultilingualTranslationCorpus-pushpaksaraf 数据来源:互联网公开数据 标签:机器翻译, 语言学, 语料库, 自然语言处理, 文本翻译, 文本分析, 印度语, 语言对 数据概述:... -
罗马化泰卢固语数据集RomanizedTeluguDataset-teachingmachine
罗马化泰卢固语数据集RomanizedTeluguDataset-teachingmachine 数据来源:互联网公开数据 标签:语言处理,泰卢固语,罗马化,数据集,自然语言处理,文本分析,语言学,机器翻译 数据概述: 该数据集包含罗马化泰卢固语文本数据,记录了泰卢固语词汇、短语或句子的罗马化转写。主要特征如下:... -
孟加拉语段落训练数据集BangaliParaTrainDataset-nilarnabdebnath
孟加拉语段落训练数据集BangaliParaTrainDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,数据集,文本分析,机器学习,语言学,文本挖掘,语言技术 数据概述:该数据集包含来自公开来源的孟加拉语段落数据,适用于自然语言处理和机器学习任务。主要特征如下:... -
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-yousifadel
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-yousifadel 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 语言学, 机器学习, 情感分析, 数据集 数据概述:... -
乌尔都语作者身份识别数据集-drkhurramshahzad
乌尔都语作者身份识别数据集-drkhurramshahzad 数据来源:互联网公开数据 标签:自然语言处理,文本分析,乌尔都语,作者识别,机器学习,文本分类,语料库,语言学 数据概述:该数据集包含来自不同作者的乌尔都语文本,用于进行作者身份识别研究。主要特征如下: 时间跨度:数据没有明确的时间跨度,主要关注文本内容。... -
越南多文档数据集VietnameseMulti-DocumentDataset-nguyenvuthanhtung
越南多文档数据集VietnameseMulti-DocumentDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:越南语,数据集,多文档,自然语言处理,文本分析,语言学,机器学习,信息检索 数据概述:该数据集包含来自越南的多文档数据,记录了越南语文本的详细信息。主要特征如下:... -
讽刺识别全球数据集SarcasmGlobalDataset-nardinehanfi
讽刺识别全球数据集SarcasmGlobalDataset-nardinehanfi 数据来源:互联网公开数据 标签:讽刺识别,数据集,自然语言处理,机器学习,文本分析,社交媒体分析,语言学,情感计算 数据概述: 该数据集来自全球多个社交媒体平台的文本数据,主要用于讽刺识别的研究和应用。主要特征如下: 时间跨度:... -
孟加拉语文本语音数据集BanglaText-to-SpeechDataset-rafihassan
孟加拉语文本语音数据集BanglaText-to-SpeechDataset-rafihassan 数据来源:互联网公开数据 标签:孟加拉语, 语音学, 文本转语音, 语音合成, 语言学, 音标, 文本数据, 数据增强 数据概述:... -
阿拉伯语方言语音特征与识别数据集ArabicDialectSpeechFeaturesandRecognitionDataset-talhaakbar
阿拉伯语方言语音特征与识别数据集ArabicDialectSpeechFeaturesandRecognitionDataset-talhaakbar 数据来源:互联网公开数据 标签:语音识别, 方言识别, 机器学习, 特征提取, 语音信号处理, 深度学习, 语言学, 声学特征 数据概述:... -
人名种族信息分析数据集PersonalNameRaceInformationAnalysis-inder123
人名种族信息分析数据集PersonalNameRaceInformationAnalysis-inder123 数据来源:互联网公开数据 标签:人名, 种族识别, 姓名分析, 文本数据, 数据清洗, 文化研究, 语言学, 数据挖掘 数据概述: 该数据集包含来自公开资料库的人名信息,记录了姓名与对应的种族信息。主要特征如下:... -
多词表达歧义消解数据集Multi-WordExpressionDisambiguationDataset-ammadhasan
多词表达歧义消解数据集Multi-WordExpressionDisambiguationDataset-ammadhasan 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 歧义消解, 多词表达, 语料库, 语言学, 机器学习, 文本理解 数据概述:... -
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-olaadelhussien
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-olaadelhussien 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 语言学, 机器学习, 语料库, 深度学习 数据概述:... -
圣经钦定版文本数据分析数据集KingJamesVersionTextAnalysisDataset-shanszu
圣经钦定版文本数据分析数据集KingJamesVersionTextAnalysisDataset-shanszu 数据来源:互联网公开数据 标签:圣经, 文本分析, 宗教, 自然语言处理, 语料库, 文本挖掘, 历史文献, 语言学 数据概述: 该数据集包含来自圣经钦定版(KJV)的文本数据,记录了圣经中各书卷、章节和经文的具体内容。主要特征如下:... -
孟加拉语-英语平行语料翻译数据集Bengali-EnglishParallelCorpusTranslationDataset-adityavirajrao
孟加拉语-英语平行语料翻译数据集Bengali-EnglishParallelCorpusTranslationDataset-adityavirajrao 数据来源:互联网公开数据 标签:机器翻译, 平行语料库, 孟加拉语, 英语, 文本翻译, 自然语言处理, 语言学, 数据集 数据概述: 该数据集包含来自开放语料库的孟加拉语-... -
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny 数据来源:互联网公开数据 标签:孟加拉语, 文本处理, 分句, 文本分割, 自然语言处理, 语料库, 机器学习, 语言学 数据概述:... -
印地语-英语翻译词汇对照数据集English-MarathiTranslationVocabularyDataset-pushkarmorankar02
印地语-英语翻译词汇对照数据集English-MarathiTranslationVocabularyDataset-pushkarmorankar02 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 词汇对照, 文本数据, 印地语, 英语, 语言学, 数据集 数据概述: 该数据集包含来自互联网的英语-... -
南非语文本多模态数据集SetswanaTextMultimodalDataset-rewardmathebula
南非语文本多模态数据集SetswanaTextMultimodalDataset-rewardmathebula 数据来源:互联网公开数据 标签:南非语, 文本分析, 多模态数据, 语言学, 文本分类, 机器学习, 自然语言处理, 数据标注 数据概述:... -
印度自然语言处理资源数据集IndicNLPResourcesDataset-arynamn
印度自然语言处理资源数据集IndicNLPResourcesDataset-arynamn 数据来源:互联网公开数据 标签:自然语言处理,印度语言,文本分析,数据集,机器学习,语言学,文化研究,多语言处理 数据概述:该数据集包含来自印度多个语言的文本资源,适用于自然语言处理和机器学习任务。主要特征如下:...