找到673个数据集

标签: 语言学

过滤结果
  • 预训练BERT大型语言模型数据集PreprosBERTLargeDataset-fattahpradiptak

    2025年4月24日   

    预训练BERT大型语言模型数据集PreprosBERTLargeDataset-fattahpradiptak 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,数据集,机器学习,文本分析,深度学习,语言学,人工智能 数据概述: 该数据集为BERT大型语言模型的预训练数据,主要包含用于训练BERT模型的文本数据。主要特征如下:...
    packageimg
  • 词义消歧数据集WSDData-abdelrahmanelbakouri

    2025年4月24日   

    词义消歧数据集WSDData-abdelrahmanelbakouri 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,数据集,语义分析,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含了用于词义消歧(Word Sense Disambiguation,...
    packageimg
  • 孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom

    2025年4月24日   

    孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,句子转换,数据集,文本生成,语言学,机器翻译,文本分析 数据概述: 该数据集包含孟加拉语的句子转换数据,记录了孟加拉语句子在不同语法结构和表达方式下的多种转换形式。主要特征如下:...
    packageimg
  • 卡纳达语情感分析数据集-kishorsinnur

    2025年4月24日   

    卡纳达语情感分析数据集-kishorsinnur 数据来源:互联网公开数据 标签:情感分析,卡纳达语,自然语言处理,数据集,文本分类,机器学习,印度语言,语言学 数据概述:该数据集包含来自各种来源的卡纳达语文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了从近期到过去一段时间的文本数据。...
    packageimg
  • 泰米尔语新闻标题翻译数据集TamilNewsHeadlinesTranslationDataset-abishpius

    2025年4月24日   

    泰米尔语新闻标题翻译数据集TamilNewsHeadlinesTranslationDataset-abishpius 数据来源:互联网公开数据 标签:泰米尔语,新闻标题,翻译,数据集,自然语言处理,机器翻译,语言学,媒体分析 数据概述:该数据集包含来自多个来源的泰米尔语新闻标题及其英文翻译,适用于自然语言处理和机器翻译等任务。主要特征如下:...
    packageimg
  • 自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369

    2025年4月24日   

    自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369 数据来源:互联网公开数据 标签:自然语言处理,语言检测,数据集,文本分析,机器学习,文本分类,语言学,计算机科学 数据概述:该数据集包含来自多个来源的文本数据,用于自然语言处理中的语言检测任务。主要特征如下:...
    packageimg
  • 英语古兰经EnglishQuranDataset-esraaaabdelrazek

    2025年4月24日   

    英语古兰经EnglishQuranDataset-esraaaabdelrazek 数据来源:互联网公开数据 标签:古兰经,数据集,宗教,伊斯兰教,翻译,文本分析,语言学,学术研究 数据概述: 该数据集包含英语翻译的《古兰经》,记录了古兰经的文本内容及其相关注释。主要特征如下: 时间跨度:数据记录的时间范围从现代翻译版本开始。...
    packageimg
  • 阿拉伯语情感对话数据集-ibrahimgahmed

    2025年4月24日   

    阿拉伯语情感对话数据集-ibrahimgahmed 数据来源:互联网公开数据 标签:阿拉伯语,情感分析,对话,自然语言处理,机器学习,文本数据,语言学,情绪识别 数据概述:该数据集包含阿拉伯语的对话数据,记录了对话参与者之间的情感表达。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了多种日常对话场景。...
    packageimg
  • 印度英语阅读理解训练数据集ChaiiTrainCleanDataset-trushk

    2025年4月24日   

    印度英语阅读理解训练数据集ChaiiTrainCleanDataset-trushk 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,数据集,文本分析,机器学习,英语,印度,语言学 数据概述: 该数据集包含来自 Chaii 竞赛的清理过的印度英语阅读理解训练数据,旨在帮助研究人员和开发人员训练和评估阅读理解模型。主要特征如下:...
    packageimg
  • UIT-VSFC诗歌翻译数据集UIT-VSFCPoemTranslationDataset-haiimphuong

    2025年4月24日   

    UIT-VSFC诗歌翻译数据集UIT-VSFCPoemTranslationDataset-haiimphuong 数据来源:互联网公开数据 标签:诗歌翻译,数据集,自然语言处理,机器翻译,文本分析,越南语,英语,语言学 数据概述: 该数据集包含来自UIT-VSFC项目提供的诗歌翻译数据,记录了越南语诗歌及其对应的英语翻译。主要特征如下:...
    packageimg
  • 多语言常用词汇数据集CommonWordsof100LanguagesDataset-coddiction

    2025年4月24日   

    多语言常用词汇数据集CommonWordsof100LanguagesDataset-coddiction 数据来源:互联网公开数据 标签:语言学,多语言,词汇数据集,自然语言处理,翻译研究,语言对比,数据科学,教育技术 数据概述: 该数据集包含来自100种不同语言的常用词汇数据,记录了各语言中的基础词汇及其对应翻译。主要特征如下:...
    packageimg
  • 中文互联网帖子处理数据集PostprocessedVernacularDataset-parthplc

    2025年4月24日   

    中文互联网帖子处理数据集PostprocessedVernacularDataset-parthplc 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,中文,社交媒体,情感分析,文本挖掘,语言学 数据概述: 该数据集包含从中文互联网收集的帖子文本数据,经过了后处理和清洗。主要特征如下:...
    packageimg
  • 日本社交平台对话数据集JapanConversationDataset-nguyencongcuong

    2025年4月24日   

    日本社交平台对话数据集JapanConversationDataset-nguyencongcuong 数据来源:互联网公开数据 标签:对话数据,日语,文本分析,自然语言处理,情感分析,社交媒体,语言学,机器学习 数据概述: 该数据集包含来自日本社交平台的用户对话数据,记录了用户间的交流内容。主要特征如下: 时间跨度:数据记录的时间范围为未知。...
    packageimg
  • 德语语法数据集GermanGrammarDataset-upamasarker

    2025年4月24日   

    德语语法数据集GermanGrammarDataset-upamasarker 数据来源:互联网公开数据 标签:语言学,语法分析,数据集,自然语言处理,教育技术,机器学习,德语学习,语言研究 数据概述: 该数据集包含来自德语语法研究项目的数据,记录了德语语法规则和例句的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 文件词汇统计数据集WordsFileDataset-jordansiem

    2025年4月24日   

    文件词汇统计数据集WordsFileDataset-jordansiem 数据来源:互联网公开数据 标签:文本分析,词汇统计,数据集,自然语言处理,数据挖掘,语言学,机器学习,教育研究 数据概述: 该数据集包含来自多个文本文件的数据,记录了不同文件中的词汇信息。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
    packageimg
  • 大规模多语种文本训练数据集ALL-MASCTrainDatasets-saeed1507100

    2025年4月24日   

    大规模多语种文本训练数据集ALL-MASCTrainDatasets-saeed1507100 数据来源:互联网公开数据 标签:文本数据,多语种,自然语言处理,机器学习,语料库,文本分析,语言学,训练数据 数据概述: 该数据集包含大规模多语种文本训练数据,主要用于自然语言处理(NLP)模型的训练和评估。主要特征如下:...
    packageimg
  • 印度语文本情感分析数据集-siddhantkhobragade

    2025年4月24日   

    印度语文本情感分析数据集-siddhantkhobragade 数据来源:互联网公开数据 标签:情感分析,印度语,文本数据,自然语言处理,机器学习,文本挖掘,社会科学,语言学 数据概述: 该数据集包含来自各种来源的印度语文本数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了近期社交媒体和其他在线平台上的文本。...
    packageimg
  • 欧洲议会命名实体识别数据集EuroParlNamedEntityRecognitionDataset-julianschelb

    2025年4月24日   

    欧洲议会命名实体识别数据集EuroParlNamedEntityRecognitionDataset-julianschelb 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器翻译,语言学,NLP,欧洲议会 数据概述: 该数据集包含来自欧洲议会会议记录的文本数据,专注于命名实体识别任务。主要特征如下:...
    packageimg
  • 阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled

    2025年4月24日   

    阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled 数据来源:互联网公开数据 标签:问答系统,自然语言处理,阿拉伯语,数据集,文本分析,信息检索,机器学习,语言学 数据概述: 该数据集收录了阿拉伯语维基百科中的问答对,旨在促进阿拉伯语问答系统的研究和开发。主要特征如下:...
    packageimg
  • 阿塞拜疆语情感分析数据集SentimentDatasetforAzerbaijaniLanguage-natigmamishov

    2025年4月24日   

    阿塞拜疆语情感分析数据集SentimentDatasetforAzerbaijaniLanguage-natigmamishov 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,阿塞拜疆语,文本挖掘,机器学习,社交媒体分析,语言学 数据概述:...
    packageimg