-
自然语言处理文本数据集NaturalLanguageProcessNLPDataset-bulentsiyah
自然语言处理文本数据集NaturalLanguageProcessNLPDataset-bulentsiyah 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,语义分析,文本挖掘,语言学,人工智能 数据概述:该数据集包含来自多个来源的文本数据,涵盖了各种类型的文本,适用于自然语言处理和机器学习等任务。主要特征如下:... -
词性标注英文语料库数据集TaggedWordsDataset-ramakrushnamohapatra
词性标注英文语料库数据集TaggedWordsDataset-ramakrushnamohapatra 数据来源:互联网公开数据 标签:词性标注,数据集,自然语言处理,机器学习,语言学,文本分析,学术研究,信息检索 数据概述:该数据集包含来自Penn Treebank的词性标注数据,记录了英文文本中每个单词的词性和上下文信息。主要特征如下:... -
豪萨语语料库数据集HausaCorporaDataset-isadutse
豪萨语语料库数据集HausaCorporaDataset-isadutse 数据来源:互联网公开数据 标签:豪萨语,语料库,语言学,自然语言处理,机器翻译,数据集,学术研究,文化研究 数据概述:该数据集包含来自多种来源的豪萨语语料,记录了豪萨语的文本数据,适用于语言学研究,自然语言处理和机器翻译等任务。主要特征如下:... -
星际迷航-深空九号剧本数据集StarTrek-DeepSpaceNineScriptsDataset-daedalusdreamjournal
星际迷航-深空九号剧本数据集StarTrek-DeepSpaceNineScriptsDataset-daedalusdreamjournal 数据来源:互联网公开数据 标签:影视剧本,星际迷航,数据集,剧本分析,文本挖掘,科幻,文化研究,语言学 数据概述: 该数据集包含来自《星际迷航:深空九号》(Star Trek: Deep Space Nine,... -
豪萨语情感分析数据集HausaSentimentAnalysisDataset-sambonuruddeen
豪萨语情感分析数据集HausaSentimentAnalysisDataset-sambonuruddeen 数据来源:互联网公开数据 标签:情感分析,自然语言处理,豪萨语,文本分析,机器学习,语言学,非洲语言,情感分类 数据概述: 该数据集包含用于豪萨语情感分析的文本数据,旨在研究和开发针对豪萨语的文本情感分析模型。主要特征如下: 时间跨度:... -
无事实依据的笑话数据集-j0hann
无事实依据的笑话数据集-j0hann 数据来源:互联网公开数据 标签:笑话,数据集,文本分析,自然语言处理,情感分析,娱乐,语言学,机器学习 数据概述: 该数据集包含了大量无事实依据的笑话,旨在用于文本分析,自然语言处理和机器学习模型训练。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和来源的笑话。... -
奥斯曼土耳其语通用依存关系数据集OttomanTurkishUniversalDependenciesDataset-emirkaanozdemr
奥斯曼土耳其语通用依存关系数据集OttomanTurkishUniversalDependenciesDataset-emirkaanozdemr 数据来源:互联网公开数据 标签:自然语言处理,土耳其语,依存分析,数据集,语言学,NLP,文本分析,历史语言 数据概述: 该数据集包含奥斯曼土耳其语的文本数据,并标注了通用依存关系。主要特征如下:... -
越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn
越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn 数据来源:互联网公开数据 标签:字幕翻译,越南语,数据集,机器翻译,自然语言处理,文本分析,语言学,跨语言 数据概述:该数据集包含从英语到越南语的字幕翻译数据,用于字幕翻译任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据来源。... -
仇恨言论检测平衡数据集-nirmalgaud
仇恨言论检测平衡数据集-nirmalgaud 数据来源:互联网公开数据 标签:仇恨言论,文本分析,自然语言处理,情感分析,数据集,机器学习,社交媒体,语言学 数据概述: 该数据集收录了来自社交媒体平台的文本数据,旨在用于仇恨言论的检测与识别。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了社交媒体上常见的文本内容发布时间。... -
泰卢固语英语翻译数据集TeluguEnglishTranslationDataset-gautamashastry
泰卢固语英语翻译数据集TeluguEnglishTranslationDataset-gautamashastry 数据来源:互联网公开数据 标签:泰卢固语,英语,翻译,数据集,语言学,自然语言处理,机器学习,文本分析 数据概述:该数据集包含来自多个来源的泰卢固语和英语的翻译数据,用于研究和开发语言翻译模型。主要特征如下:... -
多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr
多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:... -
乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan
乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan 数据来源:互联网公开数据 标签:诗歌,乌尔都语,罗马体,文本分析,自然语言处理,语言学,数据集,文化研究 数据概述: 该数据集包含了用罗马字母转写的乌尔都语诗歌,旨在促进乌尔都语诗歌的文本分析和研究。主要特征如下: 时间跨度:... -
阿拉伯语情感分析数据集-ouaraskhelilrafik
阿拉伯语情感分析数据集-ouaraskhelilrafik 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,自然语言处理,NLP,文本数据,机器学习,语言学,情感分类 数据概述: 该数据集包含阿拉伯语文本及其对应的情感标签,用于情感分析研究。主要特征如下: 时间跨度:数据的时间跨度取决于具体的数据来源,通常涵盖近年。... -
孟加拉语仇恨言论与俚语数据集-arkabhattachajee01
孟加拉语仇恨言论与俚语数据集-arkabhattachajee01 数据来源:互联网公开数据 标签:仇恨言论,俚语,孟加拉语,自然语言处理,文本分类,情感分析,社交媒体,语言学 数据概述: 该数据集包含了孟加拉语社交媒体上的仇恨言论,其中部分言论使用了俚语。主要特征如下: 时间跨度:数据记录的时间范围未知,但通常反映了社交媒体上的近期言论。... -
俄罗斯幽默笑话文本数据集
俄罗斯幽默笑话文本数据集 数据来源:互联网公开数据 标签:俄罗斯,幽默,笑话,文本,语言学,文化,娱乐 数据概述: 本数据集收录了来自俄罗斯笑话聚合网站的笑话文本。这些笑话内容涵盖了广泛的主题和风格,反映了俄罗斯独特的幽默文化。数据集由IgorVolochay在Hugging Face上发布,原始数据来源于公开的网络资源。 数据用途概述:... -
希望演讲英语修改数据集-praneeshsharma
希望演讲英语修改数据集-praneeshsharma 数据来源:互联网公开数据 标签:演讲,英语,数据集,语音识别,自然语言处理,文本分析,机器学习,语言学 数据概述: 该数据集包含修改后的英语演讲数据,旨在用于语音识别,自然语言处理和文本分析等研究。主要特征如下: 时间跨度:数据记录的时间范围跨度不确定,取决于演讲内容和录制时间。... -
中文文本翻译数据集TranslatedTextDataset-amithsurasani
中文文本翻译数据集TranslatedTextDataset-amithsurasani 数据来源:互联网公开数据 标签:文本翻译,数据集,自然语言处理,机器学习,语言学,人工智能,多语言,文本分析 数据概述: 该数据集包含来自互联网公开来源的中文文本翻译数据,记录了多种语言与中文之间的翻译对。主要特征如下:... -
美国手语短语数据集AmericanSignLanguagePhrasesDataset-gkontogiannis
美国手语短语数据集AmericanSignLanguagePhrasesDataset-gkontogiannis 数据来源:互联网公开数据 标签:手语识别,数据集,计算机视觉,深度学习,多模态,教育技术,语言学,人工智能 数据概述: 该数据集包含美国手语(ASL)的短语和句子数据,记录了手语表达的视频或图像信息。主要特征如下:... -
词汇数据集Lexicon-CleanDataset-jvmchik
词汇数据集Lexicon-CleanDataset-jvmchik 数据来源:互联网公开数据 标签:语言学,词汇学,数据集,自然语言处理,文本分析,教育研究,数据清洗,语言资源 数据概述: 该数据集包含经过清洗和标准化的词汇数据,记录了多种语言的词汇信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为静态词汇数据。... -
英语到约鲁巴语翻译数据集EnglishtoYorubaTranslationDataset-salisuyahaya
英语到约鲁巴语翻译数据集EnglishtoYorubaTranslationDataset-salisuyahaya 数据来源:互联网公开数据 标签:英语翻译,约鲁巴语,数据集,自然语言处理,机器学习,语言学,人工智能,文本翻译 数据概述: 该数据集包含来自互联网的英语到约鲁巴语的翻译数据,记录了多种主题的英语文本及其对应的约鲁巴语翻译。主要特征如下:...