找到672个数据集

标签: 语言学

过滤结果
  • 白俄罗斯语有声语音数据集BelarusianSpeechAudioDataset-siarheys

    2025年5月30日   

    白俄罗斯语有声语音数据集BelarusianSpeechAudioDataset-siarheys 数据来源:互联网公开数据 标签:语音识别, 声学模型, 语音合成, 文本转录, 语言学, 白俄罗斯语, 语音数据, 数据集 数据概述: 该数据集包含来自互联网的白俄罗斯语语音数据,记录了白俄罗斯语的语音片段及其对应的文本转录。主要特征如下:...
    packageimg
  • 文本校对与语言纠错资源数据集TextProofreadingandLanguageCorrectionResources-fcbk95

    2025年5月30日   

    文本校对与语言纠错资源数据集TextProofreadingandLanguageCorrectionResources-fcbk95 数据来源:互联网公开数据 标签:语言校对, 文本纠错, 自然语言处理, 多语言支持, 词汇校正, 语法检查, 数据集, 语言学 数据概述:...
    packageimg
  • 芬兰文本语料库2010-2020数据集-haaldrin

    2025年5月30日   

    芬兰文本语料库2010-2020数据集-haaldrin 数据来源:互联网公开数据 标签:文本语料库,自然语言处理,数据集,芬兰语,学术研究,语言学,机器学习,信息检索 数据概述:该数据集包含来自芬兰的文本数据,记录了2010年至2020年期间的多种类型的芬兰语文本。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 俄语文本情感分析数据集RussianTextSentimentAnalysisDataset-eugenegolovanoov

    2025年5月30日   

    俄语文本情感分析数据集RussianTextSentimentAnalysisDataset-eugenegolovanoov 数据来源:互联网公开数据 标签:情感分析, 俄语, 文本分类, 情感极性, 数据标注, 机器学习, 自然语言处理, 语言学 数据概述: 该数据集包含来自不同来源的俄语文本数据,旨在用于情感分析任务。主要特征如下:...
    packageimg
  • 泰卢固语维基百科数据数据集TeluguWikipediaDataDataset-asrsaiteja

    2025年5月30日   

    泰卢固语维基百科数据数据集TeluguWikipediaDataDataset-asrsaiteja 数据来源:互联网公开数据 标签:维基百科,泰卢固语,文本分析,自然语言处理,数据集,语言学,信息检索,文本挖掘 数据概述: 该数据集包含来自泰卢固语维基百科的文章数据,记录了泰卢固语维基百科中所有文章的详细信息。主要特征如下:...
    packageimg
  • 越南语-西班牙语平行语料数据集Vietnamese-SpanishParallelCorpus-duy52000751

    2025年5月30日   

    越南语-西班牙语平行语料数据集Vietnamese-SpanishParallelCorpus-duy52000751 数据来源:互联网公开数据 标签:机器翻译, 平行语料, 越南语, 西班牙语, 语言学, 自然语言处理, 语料库, 文本对齐 数据概述: 该数据集包含越南语和西班牙语的平行文本对,记录了两种语言的对应翻译示例。主要特征如下:...
    packageimg
  • 孟加拉语语音识别训练元数据数据集-imtiazprio

    2025年5月30日   

    孟加拉语语音识别训练元数据数据集-imtiazprio 数据来源:互联网公开数据 标签:语音识别,数据集,孟加拉语,语音数据,自然语言处理,声学模型,机器学习,语言学 数据概述: 该数据集包含孟加拉语语音识别训练的元数据信息,记录了用于训练语音识别模型的相关数据。主要特征如下: 时间跨度:数据记录的时间范围不明确,但通常涵盖了语音识别研究的最新进展。...
    packageimg
  • 机器翻译Transformer模型数据集TransformerMTDataset-doltinukuid

    2025年5月30日   

    机器翻译Transformer模型数据集TransformerMTDataset-doltinukuid 数据来源:互联网公开数据 标签:机器翻译,Transformer,数据集,自然语言处理,深度学习,语言学,人工智能,文本分析...
    packageimg
  • 越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan

    2025年5月30日   

    越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan 数据来源:互联网公开数据 标签:自然语言处理,情感分析,越南语,数据集,文本分类,机器学习,语言学,NLP 数据概述: 该数据集包含用于评估越南语情感分析模型的测试数据,记录了越南语文本的情感极性。主要特征如下:...
    packageimg
  • 多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules

    2025年5月30日   

    多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 文本分析, 语言学, 文本比对, 英语, 西班牙语 数据概述:...
    packageimg
  • 印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall

    2025年5月30日   

    印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall 数据来源:互联网公开数据 标签:机器翻译,英印翻译,自然语言处理,数据集,语言学,文本数据,人工智能,NLP 数据概述:...
    packageimg
  • 印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslation-dhruvsinghsachan

    2025年5月30日   

    印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslation-dhruvsinghsachan 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语料库, 印地语, 英语, 自然语言处理, 语言学, 文本分析 数据概述: 该数据集包含来自互联网的印地语-...
    packageimg
  • 日语词典数据集JPNDictDataset-abhi5ingh

    2025年5月30日   

    日语词典数据集JPNDictDataset-abhi5ingh 数据来源:互联网公开数据 标签:语言学,词典,数据集,日语学习,自然语言处理,教育,翻译,语言研究 数据概述: 该数据集包含来自日语词典的数据,记录了日语词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,但内容涵盖现代日语常用词汇。...
    packageimg
  • 阿里与飒达词汇数据集-farismuq2

    2025年5月30日   

    阿里与飒达词汇数据集-farismuq2 数据来源:互联网公开数据 标签:词汇分析,数据集,情感分析,自然语言处理,文本挖掘,中文文本,语料库,语言学 数据概述: 该数据集包含了阿里和飒达相关的词汇,旨在用于词汇分析、情感分析等自然语言处理任务。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了从早期到现代的词汇。 地理范围:...
    packageimg
  • 乌兹别克语问答数据集Question-AnswerUzbekDataset-arslonbek

    2025年5月30日   

    乌兹别克语问答数据集Question-AnswerUzbekDataset-arslonbek 数据来源:互联网公开数据 标签:乌兹别克语,问答,自然语言处理,数据集,文本分析,机器翻译,语言学,人工智能 数据概述: 该数据集包含乌兹别克语的问答对,旨在促进乌兹别克语的自然语言处理研究和应用。主要特征如下: 时间跨度:数据收集时间不限,持续更新。...
    packageimg
  • 乌兹别克语音识别数据集VoiceRecognitionUzbekDataset-bexruznutfilloyev

    2025年5月30日   

    乌兹别克语音识别数据集VoiceRecognitionUzbekDataset-bexruznutfilloyev 数据来源:互联网公开数据 标签:语音识别,乌兹别克语,数据集,自然语言处理,机器学习,语音处理,音频分析,语言学 数据概述: 该数据集包含乌兹别克语的语音数据,旨在用于语音识别系统的训练和评估。主要特征如下: 时间跨度:...
    packageimg
  • 马拉提语文档数据集MarathiDocumentsDataset-ashwanillkagechaad

    2025年5月30日   

    马拉提语文档数据集MarathiDocumentsDataset-ashwanillkagechaad 数据来源:互联网公开数据 标签:马拉提语,文档数据集,自然语言处理,机器学习,文本分析,印度文化,学术资源,语言学 数据概述: 该数据集包含来自多个来源的马拉提语文档,记录了马拉提语的文本数据,适用于自然语言处理、文本分析等任务。主要特征如下:...
    packageimg
  • 文本预处理语料库TextPreprocessingCorpus-dinhnhattruong

    2025年5月30日   

    文本预处理语料库TextPreprocessingCorpus-dinhnhattruong 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,文本挖掘,数据清洗,语言学,信息检索 数据概述:该数据集包含了来自互联网和公开出版物的文本数据,适用于文本预处理、自然语言处理等任务。主要特征如下:...
    packageimg
  • 多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo

    2025年5月30日   

    多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 语言学, 翻译模型, 文本数据, 英语, 德语, 西班牙语 数据概述:...
    packageimg
  • 泰英双语翻译文本数据集Thai-EnglishBilingualTranslationText-jaroensakyodkantha

    2025年5月30日   

    泰英双语翻译文本数据集Thai-EnglishBilingualTranslationText-jaroensakyodkantha 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 双语语料库, 泰语, 英语, 自然语言处理, 语言学, 数据清洗 数据概述:...
    packageimg