找到79个数据集

标签: 语言技术

过滤结果
  • 命名实体识别数据集NERDatasets-a7med7m0stvfa

    2025年4月26日   

    命名实体识别数据集NERDatasets-a7med7m0stvfa 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据集,人工智能,信息提取,语言技术 数据概述: 该数据集包含多种文本数据,记录了文本中的命名实体信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖多个时间段的文本数据。...
    packageimg
  • 泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit

    2025年4月25日   

    泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,泰米尔语,数据集,自然语言处理,文本分析,机器学习,信息检索,语言技术 数据概述: 该数据集包含来自泰米尔语新闻媒体的数据,记录了不同类别的泰米尔语新闻文章。主要特征如下:...
    packageimg
  • 印地语情感分析数据集HindiLanguageSentimentAnalysisDataset-maheshmj007

    2025年4月25日   

    印地语情感分析数据集HindiLanguageSentimentAnalysisDataset-maheshmj007 数据来源:互联网公开数据 标签:情感分析,自然语言处理,印地语,数据集,文本分类,机器学习,语言技术,数据分析 数据概述:...
    packageimg
  • 阿拉伯语情感分析数据集ArabicEmotionalDataset-ahmadabdelhameed

    2025年4月25日   

    阿拉伯语情感分析数据集ArabicEmotionalDataset-ahmadabdelhameed 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,数据集,自然语言处理,机器学习,文本挖掘,语言技术,情感识别 数据概述: 该数据集包含来自阿拉伯语社交媒体,评论和文本内容的情感分析数据,记录了不同场景下的文本情感倾向。主要特征如下:...
    packageimg
  • 密歇根大学自然语言处理数据集UMICHSI650NLPDataset-seesea0203

    2025年4月25日   

    密歇根大学自然语言处理数据集UMICHSI650NLPDataset-seesea0203 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,语义分析,情感识别,语言技术 数据概述: 该数据集由密歇根大学SI650课程提供,主要记录了文本数据的情感倾向分类,适用于自然语言处理和情感分析任务。主要特征如下:...
    packageimg
  • 多语言问答训练数据集-MLQA-XQUAD印地文MultilingualQuestionAnsweringTrainingDataset-MLQA-XQU...

    2025年4月25日   

    多语言问答训练数据集-MLQA-XQUAD印地文MultilingualQuestionAnsweringTrainingDataset-MLQA-XQUADHindi-abhilashgahankari 数据来源:互联网公开数据 标签:多语言问答,数据集,机器学习,自然语言处理,文本分析,印地文,问答系统,语言技术 数据概述:...
    packageimg
  • 词汇情感极性检测数据集WordSentimentDetectionPolarityof8222Words-jgabrielsb

    2025年4月25日   

    词汇情感极性检测数据集WordSentimentDetectionPolarityof8222Words-jgabrielsb 数据来源:互联网公开数据 标签:情感分析,自然语言处理,情感极性,数据集,词典,文本挖掘,机器学习,语言技术 数据概述: 该数据集包含8222个词汇的情感极性数据,记录了这些词汇在文本中表达的情感倾向。主要特征如下:...
    packageimg
  • 命名实体识别16标签数据集NamedEntityRecognitionDatasetwith16Tags-sumitv29

    2025年4月25日   

    命名实体识别16标签数据集NamedEntityRecognitionDatasetwith16Tags-sumitv29 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,机器学习,文本分析,信息提取,语言技术,人工智能 数据概述: 该数据集包含用于命名实体识别任务的数据,记录了文本中的实体及其类别信息。主要特征如下:...
    packageimg
  • 尼泊尔语句子压缩数据集SentenceCompressionNepaliDataset-sbastola73

    2025年4月25日   

    尼泊尔语句子压缩数据集SentenceCompressionNepaliDataset-sbastola73 数据来源:互联网公开数据 标签:自然语言处理,文本压缩,数据集,机器学习,语言技术,尼泊尔语,文本分析,语音识别 数据概述: 该数据集包含来自尼泊尔语文本的句子压缩数据,记录了尼泊尔语句子的原始内容和压缩后的版本。主要特征如下:...
    packageimg
  • 拼字检查与验证数据集NP-65k-Spell-ExamplesDataset-amardura

    2025年4月25日   

    拼字检查与验证数据集NP-65k-Spell-ExamplesDataset-amardura 数据来源:互联网公开数据 标签:拼字检查,数据集,自然语言处理,文本分析,机器学习,语言技术,教育辅助,拼写验证 数据概述: 该数据集包含来自公开资源的大量拼字检查示例,主要用于验证和训练拼字检查模型。主要特征如下:...
    packageimg
  • 孟加拉语合成语音数据集-drhabib

    2025年4月25日   

    孟加拉语合成语音数据集-drhabib 数据来源:互联网公开数据 标签:语音合成,孟加拉语,语音识别,数据集,自然语言处理,机器学习,声学模型,语言技术 数据概述: 该数据集包含合成的孟加拉语语音数据,用于语音合成和相关研究。主要特征如下: 时间跨度:数据生成的时间范围为[具体时间,如2023年]。...
    packageimg
  • 斯瓦希里语情感分析数据集SwahiliSentimentDataset-alfaxadeyembe

    2025年4月25日   

    斯瓦希里语情感分析数据集SwahiliSentimentDataset-alfaxadeyembe 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,语言技术,非洲语言,文本挖掘,多语言处理 数据概述: 该数据集包含来自斯瓦希里语的文本数据,记录了不同文本内容的情感倾向。主要特征如下:...
    packageimg
  • 古吉拉特语词性标注数据集POSTaggingforGujaratiLanguageDataset-vedantrajpurohit

    2025年4月25日   

    古吉拉特语词性标注数据集POSTaggingforGujaratiLanguageDataset-vedantrajpurohit 数据来源:互联网公开数据 标签:自然语言处理,词性标注,古吉拉特语,数据集,语言技术,机器学习,文本分析,多语言处理 数据概述:...
    packageimg
  • 乌尔都语新闻文本分类数据集UrduNewsTextClassificationDataset-muhammadgulraiz

    2025年4月25日   

    乌尔都语新闻文本分类数据集UrduNewsTextClassificationDataset-muhammadgulraiz 数据来源:互联网公开数据 标签:新闻文本,文本分类,乌尔都语,数据集,自然语言处理,机器学习,语言技术,信息提取 数据概述:...
    packageimg
  • 阿拉伯语拼写数据集SpellArabicDataset-twproject

    2025年4月25日   

    阿拉伯语拼写数据集SpellArabicDataset-twproject 数据来源:互联网公开数据 标签:阿拉伯语,拼写检查,数据集,自然语言处理,文本分析,机器学习,语言技术,语言学 数据概述:该数据集包含来自互联网的阿拉伯语文本数据,记录了阿拉伯语拼写错误及其正确拼写的对应关系。主要特征如下:...
    packageimg
  • 俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina

    2025年4月25日   

    俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息检索,语言技术,俄语处理 数据概述:...
    packageimg
  • 英语到印地语翻译数据集English-to-HindiTranslationDataset-pratyushojha12

    2025年4月25日   

    英语到印地语翻译数据集English-to-HindiTranslationDataset-pratyushojha12 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,印地语,英语,翻译研究,语言技术,双语数据 数据概述: 该数据集包含来自多个公开来源的英语到印地语的平行语料,记录了双语对照的句子对。主要特征如下:...
    packageimg
  • 有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281

    2025年4月25日   

    有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281 数据来源:互联网公开数据 标签:信息检索,波斯语,数据集,自然语言处理,机器学习,文本分类,多语言处理,语言技术 数据概述:...
    packageimg
  • 情感分析数据集SentimentAnalysisDataset-qacenn

    2025年4月25日   

    情感分析数据集SentimentAnalysisDataset-qacenn 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,数据挖掘,语言技术,人工智能 数据概述: 该数据集包含来自互联网公开来源的情感分析数据,记录了用户对产品,服务或内容的情感倾向。主要特征如下:...
    packageimg
  • IPA训练数据集IPATrainDataset-swagician

    2025年4月25日   

    IPA训练数据集IPATrainDataset-swagician 数据来源:互联网公开数据 标签:语音识别,数据集,语言技术,机器学习,自然语言处理,语音学,发音标准,人工智能 数据概述: 该数据集包含来自IPA(国际音标)训练项目的数据,记录了用于语音识别和发音标准化的音标及发音对应关系。主要特征如下:...
    packageimg