找到667个数据集

标签: 语言学

过滤结果
  • 语音合成法语对话数据集SpeechSynthesisFrenchDialogueDataset-canardman

    2025年5月29日   

    语音合成法语对话数据集SpeechSynthesisFrenchDialogueDataset-canardman 数据来源:互联网公开数据 标签:语音合成, 语音识别, 法语, 文本转语音, 深度学习, 声学模型, 语音数据, 语言学 数据概述:...
    packageimg
  • 数据3000本翻译成俄语的书籍数据集-dmitrybarsu

    2025年5月29日   

    3000本翻译成俄语的书籍数据集-dmitrybarsu 数据来源:互联网公开数据 标签:书籍,翻译,俄语,数据集,自然语言处理,文本分析,语言学,机器翻译 数据概述: 该数据集包含3000本已翻译成俄语的书籍文本,涵盖了多种主题和文学体裁。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同年代的翻译作品。...
    packageimg
  • 阿拉伯手语识别数据库ARASLDatabase54kFinal数据集ARASLDatabase54kFinaldataset-medfakhreeddine

    2025年5月29日   

    阿拉伯手语识别数据库ARASLDatabase54kFinal数据集ARASLDatabase54kFinaldataset-medfakhreeddine 数据来源:互联网公开数据 标签:手语识别,计算机视觉,数据集,深度学习,图像分类,人工智能,多模态,语言学 数据概述: 该数据集是阿拉伯手语识别数据库(ARASL Database 54k...
    packageimg
  • 手语词汇识别数据集IsolatedSignLanguageAggregationDataset-lonnieqin

    2025年5月29日   

    手语词汇识别数据集IsolatedSignLanguageAggregationDataset-lonnieqin 数据来源:互联网公开数据 标签:手语,数据集,图像识别,自然语言处理,机器学习,手势识别,人工智能,语言学 数据概述: 该数据集包含手语视频数据,用于手语词汇识别任务。主要特征如下:...
    packageimg
  • 泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine

    2025年5月29日   

    泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine 数据来源:互联网公开数据 标签:泰卢固语,罗马化,文本数据,自然语言处理,数据集,语言学,机器翻译,文本分析 数据概述: 该数据集包含泰卢固语文本的罗马化转写数据,记录了泰卢固语文本与其对应的罗马字母转写版本。主要特征如下:...
    packageimg
  • 歌曲歌词翻译数据集LyricTranslationDataset-xiehayan

    2025年5月29日   

    歌曲歌词翻译数据集LyricTranslationDataset-xiehayan 数据来源:互联网公开数据 标签:歌词,翻译,数据集,自然语言处理,机器翻译,文本分析,多语言,语言学 数据概述: 该数据集包含来自多个来源的歌曲歌词及其对应的翻译文本,旨在用于机器翻译、文本分析和多语言研究。主要特征如下:...
    packageimg
  • 服务条款与可读性评分数据集TermsofServiceandReadabilityScoresDataset-caitvh14

    2025年5月29日   

    服务条款与可读性评分数据集TermsofServiceandReadabilityScoresDataset-caitvh14 数据来源:互联网公开数据 标签:法律文本,可读性分析,数据集,文本处理,自然语言处理,机器学习,语言学,数据分析 数据概述: 该数据集包含来自多个互联网平台的服务条款文本以及相应的可读性评分。主要特征如下:...
    packageimg
  • 印地语语料库数据集HindiCorpusDataset-flaming0

    2025年5月29日   

    印地语语料库数据集HindiCorpusDataset-flaming0 数据来源:互联网公开数据 标签:印地语,语料库,自然语言处理,文本分析,语言学,机器学习,数据集,印度 数据概述: 该数据集包含来自互联网和公开资源的印地语文本数据,记录了印地语的丰富文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy

    2025年5月29日   

    机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy 数据来源:互联网公开数据 标签:机器翻译, 越南语, 英语, 平行语料库, 自然语言处理, 文本翻译, 数据集, 语言学 数据概述: 该数据集包含越南语-...
    packageimg
  • 数据2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong

    2025年5月29日   

    2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong 数据来源:互联网公开数据 标签:互联网文本,自然语言处理,语料库,大数据,机器学习,文本分析,人工智能,语言学 数据概述:该数据集为2024年互联网公开的文本数据,涵盖了广泛的互联网文本资源,适用于自然语言处理、文本分析等任务。主要特征如下:...
    packageimg
  • 文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh

    2025年5月29日   

    文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,语言学,文本挖掘,文本分类,文本预处理 数据概述:该数据集包含了经过采样的文本数据,每段文本的字数限制在190字内,适用于自然语言处理和文本分析任务。主要特征如下:...
    packageimg
  • 学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990

    2025年5月29日   

    学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990 数据来源:互联网公开数据 标签:文本分析, 写作评估, 自然语言处理, 语言学, 文本分类, 机器学习, 写作质量, 文本特征 数据概述: 该数据集包含学生写作文本,用于评估学生的写作水平。主要特征如下:...
    packageimg
  • 佩什瓦文献英译数据集Peshwa文献英译数据集-devavratsamak

    2025年5月29日   

    佩什瓦文献英译数据集Peshwa文献英译数据集-devavratsamak 数据来源:互联网公开数据 标签:文献翻译,数据集,英译本,马拉地语,历史研究,语言学,文献学,文化研究 数据概述:该数据集包含佩什瓦文献的英译本,记录了17世纪至19世纪马拉地地区佩什瓦王朝的历史文献及其英文翻译。主要特征如下:...
    packageimg
  • 泰卢固语图书数据集TeluguBooksDataset-vishnugandavarapu

    2025年5月29日   

    泰卢固语图书数据集TeluguBooksDataset-vishnugandavarapu 数据来源:互联网公开数据 标签:泰卢固语,图书,数据集,语言学,文化研究,文本分析,机器学习,数字资源 数据概述: 该数据集包含来自互联网的泰卢固语图书数据,记录了泰卢固语文学作品的相关信息。主要特征如下: 时间跨度:数据记录的时间范围从19世纪至今。...
    packageimg
  • 阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal

    2025年5月29日   

    阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal 数据来源:互联网公开数据 标签:阿拉伯语, 文本分析, 文本对比, 自然语言处理, 语言学, 语料库, 文本挖掘, 语义分析 数据概述: 该数据集包含来自不同来源的阿拉伯语文本,记录了用于文本对比分析的语料。主要特征如下:...
    packageimg
  • 英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar

    2025年5月29日   

    英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar 数据来源:互联网公开数据 标签:英印翻译,数据集,自然语言处理,机器翻译,语言学,人工智能,文本分析,语料库 数据概述: 该数据集包含来自Samanantar项目的英印翻译对照数据,记录了英文原文及其对应的印地文翻译。主要特征如下:...
    packageimg
  • 俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh

    2025年5月29日   

    俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh 数据来源:互联网公开数据 标签:文本语料库, 俄语, 越南语, 文本分析, 自然语言处理, 语言学, 多语言, 文本挖掘 数据概述: 该数据集包含来自互联网的俄语和越南语文本语料,主要用于语言学研究、自然语言处理模型的训练与评估。主要特征如下:...
    packageimg
  • 斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-mikemollel

    2025年4月29日   

    斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-mikemollel 数据来源:互联网公开数据 标签:斯瓦希里语, 文本分类, 新闻, 多标签分类, 语言学, 自然语言处理, 机器学习, 语料库 数据概述:...
    packageimg
  • LJ语音数据集LJSpeechDataset-preranaraom

    2025年5月29日   

    LJ语音数据集LJSpeechDataset-preranaraom 数据来源:互联网公开数据 标签:语音识别,语音合成,数据集,自然语言处理,深度学习,语音处理,音频分析,语言学 数据概述: 该数据集包含来自LibriVox项目的一位女性读者的语音录音,主要用于语音合成和语音识别研究。主要特征如下: 时间跨度:数据记录的时间范围为1960年代。...
    packageimg
  • 多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431

    2025年5月29日   

    多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431 数据来源:互联网公开数据 标签:机器翻译, 词对翻译, 多语言, 文本数据, 印度语言, 文本分析, 自然语言处理, 语言学 数据概述: 该数据集包含来自不同印度语言的词对翻译数据,旨在促进多语言翻译模型的研究与开发。主要特征如下:...
    packageimg