-
语音训练与用户行为分析数据集SpeechTrainingandUserBehaviorAnalysisDataset-felicianorn
语音训练与用户行为分析数据集SpeechTrainingandUserBehaviorAnalysisDataset-felicianorn 数据来源:互联网公开数据 标签:语音识别, 用户行为, 语音数据, 文本标注, 机器学习, 数据分析, 医疗健康, 语言学 数据概述: 该数据集包含来自Felicianorn Proyecto... -
阿姆哈拉语情感分析数据集AmharicLanguageEmotionAnalysisDataset-rookiejing
阿姆哈拉语情感分析数据集AmharicLanguageEmotionAnalysisDataset-rookiejing 数据来源:互联网公开数据 标签:情感分析, 阿姆哈拉语, 文本分类, 多标签分类, 情绪识别, 语言学, 机器学习, 自然语言处理 数据概述: 该数据集包含来自互联网的阿姆哈拉语文本,并标注了相应的情感类别。主要特征如下:... -
英法平行语料翻译数据集English-FrenchParallelCorpusforMachineTranslation-faouzimohamed
英法平行语料翻译数据集English-FrenchParallelCorpusforMachineTranslation-faouzimohamed 数据来源:互联网公开数据 标签:机器翻译, 语料库, 英法翻译, 自然语言处理, 文本对齐, 语言学, 句子级翻译, 跨语言 数据概述:... -
菲律宾宿务语DaddyBen系列文本数据集CebuanoDaddyBenTextCorpus-benzajtil
菲律宾宿务语DaddyBen系列文本数据集CebuanoDaddyBenTextCorpus-benzajtil 数据来源:互联网公开数据 标签:宿务语, 文本语料库, 方言, 语言学, 文本分析, 文化研究, 对话文本, 语言资源 数据概述: 该数据集包含来自菲律宾宿务语(Cebuano)的Daddy... -
泰米尔语仇恨言论检测数据集TamilHateSpeechDetectionDataset-shantanupatankar
泰米尔语仇恨言论检测数据集TamilHateSpeechDetectionDataset-shantanupatankar 数据来源:互联网公开数据 标签:仇恨言论, 泰米尔语, 文本分类, 情感分析, 社交媒体, 语言学, 数据标注, 机器学习 数据概述:... -
乌尔都语文本情感分类数据集UrduTextSentimentClassificationDataset-maazasad
乌尔都语文本情感分类数据集UrduTextSentimentClassificationDataset-maazasad 数据来源:互联网公开数据 标签:情感分析, 文本分类, 乌尔都语, 仇恨言论检测, 情感极性, 语言学, 机器学习, 自然语言处理 数据概述:... -
孟加拉语地区文本分类数据集BengaliRegionTextClassificationDataset-safayetrafi
孟加拉语地区文本分类数据集BengaliRegionTextClassificationDataset-safayetrafi 数据来源:互联网公开数据 标签:文本分类, 孟加拉语, 地理信息, 语言学, 自然语言处理, 多标签分类, 语料库, 情感分析 数据概述: 该数据集包含来自孟加拉地区不同区域的文本内容,旨在用于文本分类任务。主要特征如下:... -
摩洛哥阿拉伯语-英语翻译平行语料数据集MoroccanArabic-EnglishParallelCorpus-akrambel
摩洛哥阿拉伯语-英语翻译平行语料数据集MoroccanArabic-EnglishParallelCorpus-akrambel 数据来源:互联网公开数据 标签:机器翻译, 语言学, 摩洛哥阿拉伯语, 英语, 语料库, 翻译, 自然语言处理, 数据集 数据概述:... -
匈牙利语文本情感分析数据集HungarianTextSentimentAnalysis-manczalmatj
匈牙利语文本情感分析数据集HungarianTextSentimentAnalysis-manczalmatj 数据来源:互联网公开数据 标签:情感分析, 文本分类, 匈牙利语, 自然语言处理, 情感极性, 语言学, 深度学习, 数据标注 数据概述: 该数据集包含来自公开的匈牙利语文本数据,记录了对应文本的情感极性。主要特征如下:... -
多语种词语词性标注数据集MultilingualWordPart-of-SpeechTaggingDataset-khlifimohamed
多语种词语词性标注数据集MultilingualWordPart-of-SpeechTaggingDataset-khlifimohamed 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 多语言, 文本分析, 语言学, 语料库, 机器学习, 词语 数据概述:... -
卡纳达语语音转录数据集KannadaSpeechTranscriptionDataset-lokotwist
卡纳达语语音转录数据集KannadaSpeechTranscriptionDataset-lokotwist 数据来源:互联网公开数据 标签:语音识别, 语音转录, 卡纳达语, 语音数据集, 深度学习, 声学模型, 语言学, FLEURS 数据概述: 该数据集包含来自FLEURS项目(Few-shot Learning Evaluation of... -
阿拉伯语姓名与出生信息数据集ArabicNamesandBirthInformation-abdalazez
阿拉伯语姓名与出生信息数据集ArabicNamesandBirthInformation-abdalazez 数据来源:互联网公开数据 标签:阿拉伯语, 姓名, 出生信息, 人口统计, 语言学, 数据清洗, 文本分析, 数据库 数据概述: 该数据集包含来自公开渠道的阿拉伯语姓名与相关出生信息。主要特征如下:... -
印尼语文本语料库数据集IndonesianTextCorpus-nandaerwinsyah
印尼语文本语料库数据集IndonesianTextCorpus-nandaerwinsyah 数据来源:互联网公开数据 标签:印尼语, 文本语料库, 自然语言处理, 文本分析, 语言学, 语料库构建, 文本挖掘, 语言模型 数据概述: 该数据集包含来自印尼语文本语料库的数据,记录了印尼语的句子示例。主要特征如下:... -
古兰经经文英阿对照文本数据集QuranicVersesEnglish-ArabicParallelCorpus-mohamedwaelbishr2018
古兰经经文英阿对照文本数据集QuranicVersesEnglish-ArabicParallelCorpus-mohamedwaelbishr2018 数据来源:互联网公开数据 标签:古兰经, 阿拉伯语, 英语翻译, 文本数据, 宗教, 语言学, 语料库, 自然语言处理 数据概述:... -
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam 数据来源:互联网公开数据 标签:文本相似度, 阿拉伯语, 自然语言处理, 语义分析, 文本匹配, 机器翻译, 语料库, 语言学 数据概述: 该数据集包含阿拉伯语文本对,用于评估和分析文本之间的相似度。主要特征如下:... -
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom 数据来源:互联网公开数据 标签:机器翻译, 语言学, 印度语, 英语, 混合语言, 语料库, 自然语言处理, 多语言 数据概述: 该数据集包含来自互联网的印地语-英语混合语料,记录了英语、印地语以及Hinglish(印地语-... -
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi 数据来源:互联网公开数据 标签:词对齐, 自然语言处理, 文本分析, 语料库, 机器翻译, 文本处理, 数据标注, 语言学 数据概述: 该数据集包含来自不同来源的英文文本数据,记录了词级别的对齐信息,主要用于研究和开发词对齐模型。主要特征如下:... -
印尼语文本分类语料库数据集IndonesianTextClassificationCorpus-hyadukuoningroqal
印尼语文本分类语料库数据集IndonesianTextClassificationCorpus-hyadukuoningroqal 数据来源:互联网公开数据 标签:文本分类, 印尼语, 语料库, 语言学, 自然语言处理, 文本分析, 情感分析, 机器学习 数据概述: 该数据集包含来自印尼语文本的数据,记录了用于文本分类任务的句子样本。主要特征如下:... -
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-amitdasrup
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-amitdasrup 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 情感分析, 自然语言处理, 标注数据, 机器学习, 社交媒体, 语言学 数据概述: 该数据集包含来自社交媒体平台的文本数据,记录了带有仇恨言论倾向的文本样本,以及相关的标注信息。主要特征如下:... -
孟加拉语语音转录数据集BanglatoIPA-jakir57
孟加拉语语音转录数据集BanglatoIPA-jakir57 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 国际音标, 语言学, 文本处理, 机器翻译, 语音合成 数据概述: 该数据集包含孟加拉语文本及其对应的国际音标(IPA)转录,旨在支持孟加拉语语音相关的研究与应用。主要特征如下:...