找到1,291个数据集

标签: 语料库

过滤结果
  • 维基中立性语料库数据集

    2025年4月23日   

    维基中立性语料库数据集 数据来源:互联网公开数据 标签:中立性,文本分析,自然语言处理,语料库,偏见检测,文本修改,数据科学 数据概述:...
    packageimg
  • 命名实体识别数据集-土耳其语-语料库NER数据集-土耳其语-语料库-niubi666

    2025年4月23日   

    命名实体识别数据集-土耳其语-语料库NER数据集-土耳其语-语料库-niubi666 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,机器学习,文本分析,土耳其语,语料库,人工智能 数据概述:该数据集包含土耳其语的命名实体识别数据,记录了土耳其语文本中的关键实体,如人名,组织名,地名等。主要特征如下:...
    packageimg
  • 诺维雅语料库数据集NoviaKorpusDataset-noviafadina

    2025年4月23日   

    诺维雅语料库数据集NoviaKorpusDataset-noviafadina 数据来源:互联网公开数据 标签:语料库,语言学,文本分析,自然语言处理,芬兰语,数据集,文本挖掘,词汇研究 数据概述: 该数据集包含来自诺维雅应用科学大学(Novia University of Applied...
    packageimg
  • 中文新闻语料库-2011至最新-ceshine

    2025年4月23日   

    中文新闻语料库-2011至最新-ceshine 数据来源:互联网公开数据 标签:中文新闻,语料库,NLP,文本分析,传统中文,简体中文,互联网新闻,新闻媒体 数据概述:...
    packageimg
  • 美国总统演讲数据集PresidentSpeechesDataset-teballo5655kgomo

    2025年4月23日   

    美国总统演讲数据集PresidentSpeechesDataset-teballo5655kgomo 数据来源:互联网公开数据 标签:政治,演讲,历史,文本分析,自然语言处理,语料库,美国,公开演讲 数据概述: 该数据集包含了来自美国总统的演讲内容,记录了历任美国总统在不同场合发表的演讲全文。主要特征如下:...
    packageimg
  • 办公场景对话脚本数据集TheOfficeScriptsDataset-anabricio98

    2025年4月23日   

    办公场景对话脚本数据集TheOfficeScriptsDataset-anabricio98 数据来源:互联网公开数据 标签:办公场景,对话脚本,数据集,自然语言处理,文本分析,情感分析,机器学习,语料库 数据概述: 该数据集包含来自美剧《办公室》(The Office)的对话脚本数据,记录了剧中角色在工作场景中的对话内容。主要特征如下:...
    packageimg
  • 生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555

    2025年4月23日   

    生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555 数据来源:互联网公开数据 标签:生物医学,文本挖掘,自然语言处理,否定检测,语料库,新冠,药物治疗,语言学 数据概述:...
    packageimg
  • 自然语言处理项目原始数据集-emilygreen8

    2025年4月23日   

    自然语言处理项目原始数据集-emilygreen8 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本数据,语料库,数据预处理,机器学习,文本分析 数据概述: 该数据集包含用于自然语言处理(NLP)项目的原始文本数据,涵盖多种文本来源和语言。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的发布时间。...
    packageimg
  • 越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx

    2025年4月22日   

    越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx 数据来源:互联网公开数据 标签:语言学研究,越南语,词汇分析,语料库,自然语言处理,文本挖掘,语言技术,数据集 数据概述:...
    packageimg
  • 圣经文本数据集-vishnuprksh

    2025年4月22日   

    圣经文本数据集-vishnuprksh 数据来源:互联网公开数据 标签:圣经,文本分析,自然语言处理,数据集,宗教研究,语言学,文本挖掘,语料库 数据概述:该数据集包含来自圣经的文本数据,涵盖了旧约和新约的多个版本和翻译。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了圣经创作的整个时期,从公元前15世纪到公元1世纪。...
    packageimg
  • 英语模板数据集EnglishTemplatedDataset-rnaveensrinivas

    2025年4月22日   

    英语模板数据集EnglishTemplatedDataset-rnaveensrinivas 数据来源:互联网公开数据 标签:英语学习,文本分析,数据集,自然语言处理,语言模型,文本生成,语料库,写作辅助 数据概述: 该数据集包含来自各种来源的英语文本数据,旨在为英语学习和自然语言处理研究提供支持。主要特征如下:...
    packageimg
  • ROCStories与故事闭合测试语料库-2011-mrriandmstique

    2025年4月22日   

    ROCStories与故事闭合测试语料库-2011-mrriandmstique 数据来源:互联网公开数据 标签:ROCStories,故事闭合测试,常识推理,叙事结构学习,故事理解,故事生成,日常事件,常识关系,语料库 数据概述: 本数据集包含ROCStories语料库,这是一个专门为故事闭合测试(Story Cloze...
    packageimg
  • 卡纳达语评论数据集KannadaReviewDataset-kishorsinnur

    2025年4月22日   

    卡纳达语评论数据集KannadaReviewDataset-kishorsinnur 数据来源:互联网公开数据 标签:自然语言处理,卡纳达语,数据集,文本分析,情感分析,机器学习,多语言处理,语料库 数据概述:该数据集包含来自卡纳达语互联网平台的大量用户评论,记录了用户对各种产品,服务或内容的评价信息。主要特征如下:...
    packageimg
  • 越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar

    2025年4月22日   

    越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,语料库,双语数据,文本分析,人工智能,语言技术 数据概述: 该数据集包含越南语与德语的平行语料数据,记录了两种语言之间的对齐文本。主要特征如下:...
    packageimg
  • 爱尔兰古语与中古爱尔兰语语料库数据集-noahsullivan

    2025年4月22日   

    爱尔兰古语与中古爱尔兰语语料库数据集-noahsullivan 数据来源:互联网公开数据 标签:语料库,古语,中古爱尔兰语,自然语言处理,词典,语言学,历史,文化,文本分析 数据概述: 本数据集为《爱尔兰古语与中古爱尔兰语语料库》(Corpus PalaeoHibernicum,...
    packageimg
  • 英语-印地语转换语料库数据集

    2025年4月22日   

    英语-印地语转换语料库数据集 数据来源:互联网公开数据 标签:语料库, 语言转换, 英语, 印地语, 语言处理, 自然语言处理, 翻译模型, 音素脚本, 语言编码 数据概述:...
    packageimg
  • COVID-19疫情研究论文多语言标注数据集-rebeccaburwei

    2025年4月22日   

    COVID-19疫情研究论文多语言标注数据集-rebeccaburwei 数据来源:互联网公开数据 标签:COVID-19,新冠病毒,疫情,研究,论文,语言,多语言,标注,语料库,自然语言处理 数据概述:...
    packageimg
  • 英语-马拉雅拉姆语言翻译数据集-nihalthomas15

    2025年4月22日   

    英语-马拉雅拉姆语言翻译数据集-nihalthomas15 数据来源:互联网公开数据 标签:英语,马拉雅拉姆,机器翻译,NLP,语料库,翻译,数据集,多语言 数据概述:...
    packageimg
  • 威尔士语词典语料库词汇及语境分析数据集-rtatman

    2025年4月22日   

    威尔士语词典语料库词汇及语境分析数据集-rtatman 数据来源:互联网公开数据 标签:威尔士语,词典,语言学,语料库,词汇,语言分析,凯尔特语,翻译,双语,单语 数据概述:...
    packageimg
  • 索马里语文本语料库-清洗后句子数据集-hassen7

    2025年4月22日   

    索马里语文本语料库-清洗后句子数据集-hassen7 数据来源:互联网公开数据 标签:索马里语,语言学,文本数据,自然语言处理,句子,清洗,语料库 数据概述:...
    packageimg