找到672个数据集

标签: 语言学

过滤结果
  • 佩什瓦文献英译数据集Peshwa文献英译数据集-devavratsamak

    2025年5月29日   

    佩什瓦文献英译数据集Peshwa文献英译数据集-devavratsamak 数据来源:互联网公开数据 标签:文献翻译,数据集,英译本,马拉地语,历史研究,语言学,文献学,文化研究 数据概述:该数据集包含佩什瓦文献的英译本,记录了17世纪至19世纪马拉地地区佩什瓦王朝的历史文献及其英文翻译。主要特征如下:...
    packageimg
  • 泰卢固语图书数据集TeluguBooksDataset-vishnugandavarapu

    2025年5月29日   

    泰卢固语图书数据集TeluguBooksDataset-vishnugandavarapu 数据来源:互联网公开数据 标签:泰卢固语,图书,数据集,语言学,文化研究,文本分析,机器学习,数字资源 数据概述: 该数据集包含来自互联网的泰卢固语图书数据,记录了泰卢固语文学作品的相关信息。主要特征如下: 时间跨度:数据记录的时间范围从19世纪至今。...
    packageimg
  • 阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal

    2025年5月29日   

    阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal 数据来源:互联网公开数据 标签:阿拉伯语, 文本分析, 文本对比, 自然语言处理, 语言学, 语料库, 文本挖掘, 语义分析 数据概述: 该数据集包含来自不同来源的阿拉伯语文本,记录了用于文本对比分析的语料。主要特征如下:...
    packageimg
  • 英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar

    2025年5月29日   

    英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar 数据来源:互联网公开数据 标签:英印翻译,数据集,自然语言处理,机器翻译,语言学,人工智能,文本分析,语料库 数据概述: 该数据集包含来自Samanantar项目的英印翻译对照数据,记录了英文原文及其对应的印地文翻译。主要特征如下:...
    packageimg
  • 俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh

    2025年5月29日   

    俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh 数据来源:互联网公开数据 标签:文本语料库, 俄语, 越南语, 文本分析, 自然语言处理, 语言学, 多语言, 文本挖掘 数据概述: 该数据集包含来自互联网的俄语和越南语文本语料,主要用于语言学研究、自然语言处理模型的训练与评估。主要特征如下:...
    packageimg
  • 斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-mikemollel

    2025年4月29日   

    斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-mikemollel 数据来源:互联网公开数据 标签:斯瓦希里语, 文本分类, 新闻, 多标签分类, 语言学, 自然语言处理, 机器学习, 语料库 数据概述:...
    packageimg
  • LJ语音数据集LJSpeechDataset-preranaraom

    2025年5月29日   

    LJ语音数据集LJSpeechDataset-preranaraom 数据来源:互联网公开数据 标签:语音识别,语音合成,数据集,自然语言处理,深度学习,语音处理,音频分析,语言学 数据概述: 该数据集包含来自LibriVox项目的一位女性读者的语音录音,主要用于语音合成和语音识别研究。主要特征如下: 时间跨度:数据记录的时间范围为1960年代。...
    packageimg
  • 多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431

    2025年5月29日   

    多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431 数据来源:互联网公开数据 标签:机器翻译, 词对翻译, 多语言, 文本数据, 印度语言, 文本分析, 自然语言处理, 语言学 数据概述: 该数据集包含来自不同印度语言的词对翻译数据,旨在促进多语言翻译模型的研究与开发。主要特征如下:...
    packageimg
  • 印度尼西亚新闻数据集2-2020年IndonesianNewsDataset2-2020-alvonsukardi

    2025年5月29日   

    印度尼西亚新闻数据集2-2020年IndonesianNewsDataset2-2020-alvonsukardi 数据来源:互联网公开数据 标签:印尼新闻,数据集,自然语言处理,文本分析,机器学习,社会研究,媒体分析,语言学 数据概述:该数据集包含来自印度尼西亚各大媒体平台的新闻数据,记录了2020年全年发布的新闻文章。主要特征如下:...
    packageimg
  • 马拉雅拉姆字符集数据集MalayalamCharacterSetDataset-raven111

    2025年5月29日   

    马拉雅拉姆字符集数据集MalayalamCharacterSetDataset-raven111 数据来源:互联网公开数据 标签:马拉雅拉姆字符,数据集,语言学,字符识别,机器学习,自然语言处理,学术资源,多语言支持 数据概述: 该数据集包含来自互联网公开资源的马拉雅拉姆字符集,记录了马拉雅拉姆语的各种字符及其相关信息。主要特征如下: 时间跨度:...
    packageimg
  • 英语到印地语翻译数据集English-to-HindiTranslationDataset-rkumarbengaluru

    2025年5月29日   

    英语到印地语翻译数据集English-to-HindiTranslationDataset-rkumarbengaluru 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言转换,印地语,英语,文本分析,语言学 数据概述: 该数据集包含英语到印地语的平行语料,记录了成对的英语原文和对应的印地语翻译。主要特征如下:...
    packageimg
  • 阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb

    2025年5月29日   

    阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 社交媒体, 语言学, 情感分析, 语料库 数据概述:...
    packageimg
  • 语言文字文本对比研究数据集LanguageTextComparisonCorpus-ayushmuley

    2025年5月28日   

    语言文字文本对比研究数据集LanguageTextComparisonCorpus-ayushmuley 数据来源:互联网公开数据 标签:语言学, 文本分析, 文本对比, 语料库, 罗马字母, 梵文, 文本挖掘, 机器学习 数据概述: 该数据集包含来自语言学研究领域的数据,记录了罗马字母转写梵文的文本。主要特征如下:...
    packageimg
  • 翻译质量评估数据集QuACE数据集-emam2002

    2025年5月28日   

    翻译质量评估数据集QuACE数据集-emam2002 数据来源:互联网公开数据 标签:机器翻译,数据集,翻译质量评估,自然语言处理,文本分析,语言学,深度学习,文本相似度 数据概述: 该数据集包含来自 QuACE(Quality Assessment of Computer-Enhanced...
    packageimg
  • 语音合成训练数据集TTSTrainingDataset-ayushs9020

    2025年5月28日   

    语音合成训练数据集TTSTrainingDataset-ayushs9020 数据来源:互联网公开数据 标签:语音合成,数据集,机器学习,自然语言处理,人工智能,语言学,语音识别,文本转语音 数据概述:该数据集包含来自多个来源的语音合成训练数据,记录了文本与相应语音的对应关系,用于训练语音合成模型。主要特征如下:...
    packageimg
  • 英语到印地语翻译数据集-amnydv17

    2025年5月28日   

    英语到印地语翻译数据集-amnydv17 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言学,英语,印地语,文本翻译,深度学习 数据概述: 该数据集包含了大量的英语到印地语的翻译文本对,旨在用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据集的构建时间跨度不固定,持续更新和扩展。...
    packageimg
  • 印地语-英语平行语料库数据集-harshityadavjnu

    2025年5月28日   

    印地语-英语平行语料库数据集-harshityadavjnu 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,印地语,英语,语料库,语言学,文本分析,跨语言 数据概述:该数据集包含印地语和英语的平行文本数据,旨在用于机器翻译、跨语言信息检索等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于语料库的收集时间。...
    packageimg
  • 英语文档学习与研究数据集LECREnglishDocumentsDataset-gabrielbchacon

    2025年5月28日   

    英语文档学习与研究数据集LECREnglishDocumentsDataset-gabrielbchacon 数据来源:互联网公开数据 标签:英语文档,数据集,语言学,自然语言处理,机器学习,文本分析,教育,学术研究 数据概述:...
    packageimg
  • 越南语句情感分析数据集-taitruong256

    2025年5月28日   

    越南语句情感分析数据集-taitruong256 数据来源:互联网公开数据 标签:越南语,情感分析,NLP,数据集,文本处理,机器学习,自然语言处理,语言学 数据概述: 该数据集包含来自越南语的句子及其对应的情感标签,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,但包含多个不同时期的越南语文本。...
    packageimg
  • 越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen

    2025年5月28日   

    越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen 数据来源:互联网公开数据 标签:机器翻译,语料库,越南语,苗语,语言学,自然语言处理,双语数据,文本数据 数据概述: 该数据集包含越南语和苗语的双语平行文本,旨在促进越南语和苗语之间的机器翻译研究。主要特征如下:...
    packageimg