找到667个数据集

标签: 语言学

过滤结果
  • 命名实体识别新闻语料库NamedEntityRecognitionNewsCorpus-henry41148

    2025年5月19日   

    命名实体识别新闻语料库NamedEntityRecognitionNewsCorpus-henry41148 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 语料库, 信息抽取, 机器学习, 文本分析, 语言学 数据概述: 该数据集包含来自新闻报道的文本数据,记录了经过人工标注的命名实体信息。主要特征如下:...
    packageimg
  • 泰卢固语仇恨言论检测数据集TeluguHateSpeechDetectionDataset-ui19co65

    2025年5月19日   

    泰卢固语仇恨言论检测数据集TeluguHateSpeechDetectionDataset-ui19co65 数据来源:互联网公开数据 标签:仇恨言论, 泰卢固语, 文本分类, 情感分析, 语言学, 自然语言处理, 恶意内容检测, 数据标注 数据概述: 该数据集包含来自互联网的泰卢固语社交媒体评论,记录了用于识别仇恨言论的文本样本。主要特征如下:...
    packageimg
  • 印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslationDataset-swapanroy

    2025年5月18日   

    印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslationDataset-swapanroy 数据来源:互联网公开数据 标签:机器翻译, 语料库, 印地语, 英语, 文本数据, 语言学, 双语对照, 自然语言处理 数据概述: 该数据集包含印地语-英语平行语料,记录了印地语和英语的句子对。主要特征如下:...
    packageimg
  • 自然语言处理项目文本数据集NLPDataProject-TextDataset-zafiransari12

    2025年5月18日   

    自然语言处理项目文本数据集NLPDataProject-TextDataset-zafiransari12 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,语言学,文本分析,文本挖掘,人工智能 数据概述:该数据集为自然语言处理项目的一部分,主要记录了用于训练和测试自然语言处理模型的文本数据。主要特征如下:...
    packageimg
  • 马达加斯加语语音识别数据集MalagasySpeechRecognitionDataset-misandratrarazafy

    2025年5月17日   

    马达加斯加语语音识别数据集MalagasySpeechRecognitionDataset-misandratrarazafy 数据来源:互联网公开数据 标签:语音识别, 马达加斯加语, 声学模型, 语音转录, 深度学习, 语音数据集, 语言学, 音频数据 数据概述:...
    packageimg
  • 印地语词汇翻译对照数据集HindiVocabularyTranslationDataset-vivekreddybandi

    2025年5月17日   

    印地语词汇翻译对照数据集HindiVocabularyTranslationDataset-vivekreddybandi 数据来源:互联网公开数据 标签:印地语, 词汇翻译, 文本数据, 机器翻译, 语言学, 数据集, 自然语言处理, 词典 数据概述: 该数据集包含印地语词汇与其对应的英文翻译,旨在促进印地语语言学习和机器翻译模型训练。主要特征如下:...
    packageimg
  • 多词表达歧义消解数据集Multi-WordExpressionDisambiguationDataset-ammadhasan

    2025年5月16日   

    多词表达歧义消解数据集Multi-WordExpressionDisambiguationDataset-ammadhasan 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 歧义消解, 多词表达, 语料库, 语言学, 机器学习, 文本理解 数据概述:...
    packageimg
  • 阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-olaadelhussien

    2025年5月16日   

    阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-olaadelhussien 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 语言学, 机器学习, 语料库, 深度学习 数据概述:...
    packageimg
  • 英汉阿拉伯语翻译数据集450-510句对-emam2002

    2025年5月16日   

    英汉阿拉伯语翻译数据集450-510句对-emam2002 数据来源:互联网公开数据 标签:机器翻译,语言学,数据集,阿拉伯语,英语,翻译,自然语言处理,文本数据 数据概述: 该数据集包含450到510个英汉-阿拉伯语翻译对,旨在促进英汉和阿拉伯语之间的机器翻译研究和开发。主要特征如下: 时间跨度:数据主要集中在当前语言使用情境。...
    packageimg
  • 阿拉伯语词频统计数据集ArabicWordFrequencyStatistics-mohamedahmed21

    2025年5月15日   

    阿拉伯语词频统计数据集ArabicWordFrequencyStatistics-mohamedahmed21 数据来源:互联网公开数据 标签:阿拉伯语, 词频统计, 自然语言处理, 文本分析, 语言学, 数据挖掘, 情感分析, 文本预处理 数据概述: 该数据集包含来自阿拉伯语文本的数据,记录了阿拉伯语单词及其出现频率。主要特征如下:...
    packageimg
  • 古兰经注释数据集Quran-TahberDataset-eslamsalah123

    2025年5月15日   

    古兰经注释数据集Quran-TahberDataset-eslamsalah123 数据来源:互联网公开数据 标签:古兰经,注释,宗教研究,文本分析,文化研究,伊斯兰教,数据集,语言学 数据概述: 该数据集包含来自多种来源的古兰经注释,记录了古兰经各个章节和节文的详细注释内容。主要特征如下:...
    packageimg
  • 马拉雅拉姆语命名实体识别数据集MalayalamLanguageNamedEntityRecognitionDataset-rajumavinmar

    2025年5月15日   

    马拉雅拉姆语命名实体识别数据集MalayalamLanguageNamedEntityRecognitionDataset-rajumavinmar 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 马拉雅拉姆语, 文本标注, 语言学, 机器学习, 文本分析, 语料库 数据概述:...
    packageimg
  • 泰卢固语词性标注数据集TeluguPart-of-SpeechTaggingDataset-icode100

    2025年5月15日   

    泰卢固语词性标注数据集TeluguPart-of-SpeechTaggingDataset-icode100 数据来源:互联网公开数据 标签:自然语言处理, 词性标注, 泰卢固语, 语言学, 文本分析, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含泰卢固语文本,记录了每个词语及其对应的词性标签。主要特征如下:...
    packageimg
  • 英法双语翻译短语数据集English-FrenchBilingualTranslationPhrases-nibakh

    2025年5月15日   

    英法双语翻译短语数据集English-FrenchBilingualTranslationPhrases-nibakh 数据来源:互联网公开数据 标签:机器翻译, 语言学, 双语语料库, 文本数据, 自然语言处理, 翻译模型, 语言对, 语料分析 数据概述: 该数据集包含英法双语短语翻译数据,记录了英语短语及其对应的法语翻译。主要特征如下:...
    packageimg
  • 越南语10万句数据集-duongtrunghien

    2025年5月15日   

    越南语10万句数据集-duongtrunghien 数据来源:互联网公开数据 标签:越南语,数据集,自然语言处理,文本分析,机器翻译,语言学,文本语料库,NLP 数据概述: 该数据集包含约10万句越南语文本,涵盖了多种主题和语体。主要特征如下: 时间跨度:数据无明确的时间范围,主要反映现代越南语的使用情况。...
    packageimg
  • 泰卢固语文本翻译数据集TeluguTextTranslationDataset-singh94135

    2025年5月14日   

    泰卢固语文本翻译数据集TeluguTextTranslationDataset-singh94135 数据来源:互联网公开数据 标签:机器翻译, 泰卢固语, 语言学, 文本数据, 自然语言处理, 翻译模型, 双语对照, 数据集 数据概述: 该数据集包含泰卢固语的文本翻译数据,记录了泰卢固语词汇或短语及其对应的翻译。主要特征如下:...
    packageimg
  • 僧伽罗语对话数据集SinhalaDialogueDataset-preminda

    2025年5月14日   

    僧伽罗语对话数据集SinhalaDialogueDataset-preminda 数据来源:互联网公开数据 标签:僧伽罗语, 文本数据, 对话语料, 语言学, 自然语言处理, 文本分析, 语料库, 机器学习 数据概述: 该数据集包含来自公开渠道的僧伽罗语对话文本,记录了不同场景下的对话内容。主要特征如下:...
    packageimg
  • 孟加拉语语料库2022数据集-srjony

    2025年5月14日   

    孟加拉语语料库2022数据集-srjony 数据来源:互联网公开数据 标签:孟加拉语,语料库,自然语言处理,文本分析,机器学习,语言学,学术研究,数据集 数据概述:该数据集包含来自多个来源的孟加拉语文本数据,记录了广泛的孟加拉语语料,适用于自然语言处理、文本分析等任务。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。...
    packageimg
  • 英俄平行语料翻译数据集English-RussianParallelTranslationDataset-user17234

    2025年5月14日   

    英俄平行语料翻译数据集English-RussianParallelTranslationDataset-user17234 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 文本对齐, 语言学, 俄语, 英语, 语言模型 数据概述: 该数据集包含来自互联网的英俄平行语料,记录了英语句子及其对应的俄语翻译。主要特征如下:...
    packageimg
  • 法语文本翻译数据集FrenchTextTranslation-aadiwalid

    2025年5月14日   

    法语文本翻译数据集FrenchTextTranslation-aadiwalid 数据来源:互联网公开数据 标签:机器翻译, 法语, 文本数据, 自然语言处理, 语料库, 语言学, 数据分析, 翻译模型 数据概述: 该数据集包含来自互联网的法语文本片段,主要用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料。...
    packageimg