找到673个数据集

标签: 语言学

过滤结果
  • 自然语言处理文本数据集NaturalLanguageProcessNLPDataset-bulentsiyah

    2025年4月24日   

    自然语言处理文本数据集NaturalLanguageProcessNLPDataset-bulentsiyah 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,语义分析,文本挖掘,语言学,人工智能 数据概述:该数据集包含来自多个来源的文本数据,涵盖了各种类型的文本,适用于自然语言处理和机器学习等任务。主要特征如下:...
    packageimg
  • 词性标注英文语料库数据集TaggedWordsDataset-ramakrushnamohapatra

    2025年4月24日   

    词性标注英文语料库数据集TaggedWordsDataset-ramakrushnamohapatra 数据来源:互联网公开数据 标签:词性标注,数据集,自然语言处理,机器学习,语言学,文本分析,学术研究,信息检索 数据概述:该数据集包含来自Penn Treebank的词性标注数据,记录了英文文本中每个单词的词性和上下文信息。主要特征如下:...
    packageimg
  • 豪萨语语料库数据集HausaCorporaDataset-isadutse

    2025年4月24日   

    豪萨语语料库数据集HausaCorporaDataset-isadutse 数据来源:互联网公开数据 标签:豪萨语,语料库,语言学,自然语言处理,机器翻译,数据集,学术研究,文化研究 数据概述:该数据集包含来自多种来源的豪萨语语料,记录了豪萨语的文本数据,适用于语言学研究,自然语言处理和机器翻译等任务。主要特征如下:...
    packageimg
  • 星际迷航-深空九号剧本数据集StarTrek-DeepSpaceNineScriptsDataset-daedalusdreamjournal

    2025年4月24日   

    星际迷航-深空九号剧本数据集StarTrek-DeepSpaceNineScriptsDataset-daedalusdreamjournal 数据来源:互联网公开数据 标签:影视剧本,星际迷航,数据集,剧本分析,文本挖掘,科幻,文化研究,语言学 数据概述: 该数据集包含来自《星际迷航:深空九号》(Star Trek: Deep Space Nine,...
    packageimg
  • 豪萨语情感分析数据集HausaSentimentAnalysisDataset-sambonuruddeen

    2025年4月24日   

    豪萨语情感分析数据集HausaSentimentAnalysisDataset-sambonuruddeen 数据来源:互联网公开数据 标签:情感分析,自然语言处理,豪萨语,文本分析,机器学习,语言学,非洲语言,情感分类 数据概述: 该数据集包含用于豪萨语情感分析的文本数据,旨在研究和开发针对豪萨语的文本情感分析模型。主要特征如下: 时间跨度:...
    packageimg
  • 无事实依据的笑话数据集-j0hann

    2025年4月24日   

    无事实依据的笑话数据集-j0hann 数据来源:互联网公开数据 标签:笑话,数据集,文本分析,自然语言处理,情感分析,娱乐,语言学,机器学习 数据概述: 该数据集包含了大量无事实依据的笑话,旨在用于文本分析,自然语言处理和机器学习模型训练。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和来源的笑话。...
    packageimg
  • 奥斯曼土耳其语通用依存关系数据集OttomanTurkishUniversalDependenciesDataset-emirkaanozdemr

    2025年4月24日   

    奥斯曼土耳其语通用依存关系数据集OttomanTurkishUniversalDependenciesDataset-emirkaanozdemr 数据来源:互联网公开数据 标签:自然语言处理,土耳其语,依存分析,数据集,语言学,NLP,文本分析,历史语言 数据概述: 该数据集包含奥斯曼土耳其语的文本数据,并标注了通用依存关系。主要特征如下:...
    packageimg
  • 越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn

    2025年4月24日   

    越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn 数据来源:互联网公开数据 标签:字幕翻译,越南语,数据集,机器翻译,自然语言处理,文本分析,语言学,跨语言 数据概述:该数据集包含从英语到越南语的字幕翻译数据,用于字幕翻译任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据来源。...
    packageimg
  • 仇恨言论检测平衡数据集-nirmalgaud

    2025年4月24日   

    仇恨言论检测平衡数据集-nirmalgaud 数据来源:互联网公开数据 标签:仇恨言论,文本分析,自然语言处理,情感分析,数据集,机器学习,社交媒体,语言学 数据概述: 该数据集收录了来自社交媒体平台的文本数据,旨在用于仇恨言论的检测与识别。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了社交媒体上常见的文本内容发布时间。...
    packageimg
  • 泰卢固语英语翻译数据集TeluguEnglishTranslationDataset-gautamashastry

    2025年4月24日   

    泰卢固语英语翻译数据集TeluguEnglishTranslationDataset-gautamashastry 数据来源:互联网公开数据 标签:泰卢固语,英语,翻译,数据集,语言学,自然语言处理,机器学习,文本分析 数据概述:该数据集包含来自多个来源的泰卢固语和英语的翻译数据,用于研究和开发语言翻译模型。主要特征如下:...
    packageimg
  • 多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr

    2025年4月24日   

    多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:...
    packageimg
  • 乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan

    2025年4月24日   

    乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan 数据来源:互联网公开数据 标签:诗歌,乌尔都语,罗马体,文本分析,自然语言处理,语言学,数据集,文化研究 数据概述: 该数据集包含了用罗马字母转写的乌尔都语诗歌,旨在促进乌尔都语诗歌的文本分析和研究。主要特征如下: 时间跨度:...
    packageimg
  • 阿拉伯语情感分析数据集-ouaraskhelilrafik

    2025年4月24日   

    阿拉伯语情感分析数据集-ouaraskhelilrafik 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,自然语言处理,NLP,文本数据,机器学习,语言学,情感分类 数据概述: 该数据集包含阿拉伯语文本及其对应的情感标签,用于情感分析研究。主要特征如下: 时间跨度:数据的时间跨度取决于具体的数据来源,通常涵盖近年。...
    packageimg
  • 孟加拉语仇恨言论与俚语数据集-arkabhattachajee01

    2025年4月24日   

    孟加拉语仇恨言论与俚语数据集-arkabhattachajee01 数据来源:互联网公开数据 标签:仇恨言论,俚语,孟加拉语,自然语言处理,文本分类,情感分析,社交媒体,语言学 数据概述: 该数据集包含了孟加拉语社交媒体上的仇恨言论,其中部分言论使用了俚语。主要特征如下: 时间跨度:数据记录的时间范围未知,但通常反映了社交媒体上的近期言论。...
    packageimg
  • 俄罗斯幽默笑话文本数据集

    2025年4月24日   

    俄罗斯幽默笑话文本数据集 数据来源:互联网公开数据 标签:俄罗斯,幽默,笑话,文本,语言学,文化,娱乐 数据概述: 本数据集收录了来自俄罗斯笑话聚合网站的笑话文本。这些笑话内容涵盖了广泛的主题和风格,反映了俄罗斯独特的幽默文化。数据集由IgorVolochay在Hugging Face上发布,原始数据来源于公开的网络资源。 数据用途概述:...
    packageimg
  • 希望演讲英语修改数据集-praneeshsharma

    2025年4月24日   

    希望演讲英语修改数据集-praneeshsharma 数据来源:互联网公开数据 标签:演讲,英语,数据集,语音识别,自然语言处理,文本分析,机器学习,语言学 数据概述: 该数据集包含修改后的英语演讲数据,旨在用于语音识别,自然语言处理和文本分析等研究。主要特征如下: 时间跨度:数据记录的时间范围跨度不确定,取决于演讲内容和录制时间。...
    packageimg
  • 中文文本翻译数据集TranslatedTextDataset-amithsurasani

    2025年4月24日   

    中文文本翻译数据集TranslatedTextDataset-amithsurasani 数据来源:互联网公开数据 标签:文本翻译,数据集,自然语言处理,机器学习,语言学,人工智能,多语言,文本分析 数据概述: 该数据集包含来自互联网公开来源的中文文本翻译数据,记录了多种语言与中文之间的翻译对。主要特征如下:...
    packageimg
  • 美国手语短语数据集AmericanSignLanguagePhrasesDataset-gkontogiannis

    2025年4月24日   

    美国手语短语数据集AmericanSignLanguagePhrasesDataset-gkontogiannis 数据来源:互联网公开数据 标签:手语识别,数据集,计算机视觉,深度学习,多模态,教育技术,语言学,人工智能 数据概述: 该数据集包含美国手语(ASL)的短语和句子数据,记录了手语表达的视频或图像信息。主要特征如下:...
    packageimg
  • 词汇数据集Lexicon-CleanDataset-jvmchik

    2025年4月24日   

    词汇数据集Lexicon-CleanDataset-jvmchik 数据来源:互联网公开数据 标签:语言学,词汇学,数据集,自然语言处理,文本分析,教育研究,数据清洗,语言资源 数据概述: 该数据集包含经过清洗和标准化的词汇数据,记录了多种语言的词汇信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为静态词汇数据。...
    packageimg
  • 英语到约鲁巴语翻译数据集EnglishtoYorubaTranslationDataset-salisuyahaya

    2025年4月24日   

    英语到约鲁巴语翻译数据集EnglishtoYorubaTranslationDataset-salisuyahaya 数据来源:互联网公开数据 标签:英语翻译,约鲁巴语,数据集,自然语言处理,机器学习,语言学,人工智能,文本翻译 数据概述: 该数据集包含来自互联网的英语到约鲁巴语的翻译数据,记录了多种主题的英语文本及其对应的约鲁巴语翻译。主要特征如下:...
    packageimg