-
-
命名实体识别数据集-土耳其语-语料库NER数据集-土耳其语-语料库-niubi666
命名实体识别数据集-土耳其语-语料库NER数据集-土耳其语-语料库-niubi666 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,机器学习,文本分析,土耳其语,语料库,人工智能 数据概述:该数据集包含土耳其语的命名实体识别数据,记录了土耳其语文本中的关键实体,如人名,组织名,地名等。主要特征如下:... -
诺维雅语料库数据集NoviaKorpusDataset-noviafadina
诺维雅语料库数据集NoviaKorpusDataset-noviafadina 数据来源:互联网公开数据 标签:语料库,语言学,文本分析,自然语言处理,芬兰语,数据集,文本挖掘,词汇研究 数据概述: 该数据集包含来自诺维雅应用科学大学(Novia University of Applied... -
中文新闻语料库-2011至最新-ceshine
中文新闻语料库-2011至最新-ceshine 数据来源:互联网公开数据 标签:中文新闻,语料库,NLP,文本分析,传统中文,简体中文,互联网新闻,新闻媒体 数据概述:... -
美国总统演讲数据集PresidentSpeechesDataset-teballo5655kgomo
美国总统演讲数据集PresidentSpeechesDataset-teballo5655kgomo 数据来源:互联网公开数据 标签:政治,演讲,历史,文本分析,自然语言处理,语料库,美国,公开演讲 数据概述: 该数据集包含了来自美国总统的演讲内容,记录了历任美国总统在不同场合发表的演讲全文。主要特征如下:... -
办公场景对话脚本数据集TheOfficeScriptsDataset-anabricio98
办公场景对话脚本数据集TheOfficeScriptsDataset-anabricio98 数据来源:互联网公开数据 标签:办公场景,对话脚本,数据集,自然语言处理,文本分析,情感分析,机器学习,语料库 数据概述: 该数据集包含来自美剧《办公室》(The Office)的对话脚本数据,记录了剧中角色在工作场景中的对话内容。主要特征如下:... -
生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555
生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555 数据来源:互联网公开数据 标签:生物医学,文本挖掘,自然语言处理,否定检测,语料库,新冠,药物治疗,语言学 数据概述:... -
自然语言处理项目原始数据集-emilygreen8
自然语言处理项目原始数据集-emilygreen8 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本数据,语料库,数据预处理,机器学习,文本分析 数据概述: 该数据集包含用于自然语言处理(NLP)项目的原始文本数据,涵盖多种文本来源和语言。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的发布时间。... -
越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx
越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx 数据来源:互联网公开数据 标签:语言学研究,越南语,词汇分析,语料库,自然语言处理,文本挖掘,语言技术,数据集 数据概述:... -
圣经文本数据集-vishnuprksh
圣经文本数据集-vishnuprksh 数据来源:互联网公开数据 标签:圣经,文本分析,自然语言处理,数据集,宗教研究,语言学,文本挖掘,语料库 数据概述:该数据集包含来自圣经的文本数据,涵盖了旧约和新约的多个版本和翻译。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了圣经创作的整个时期,从公元前15世纪到公元1世纪。... -
英语模板数据集EnglishTemplatedDataset-rnaveensrinivas
英语模板数据集EnglishTemplatedDataset-rnaveensrinivas 数据来源:互联网公开数据 标签:英语学习,文本分析,数据集,自然语言处理,语言模型,文本生成,语料库,写作辅助 数据概述: 该数据集包含来自各种来源的英语文本数据,旨在为英语学习和自然语言处理研究提供支持。主要特征如下:... -
ROCStories与故事闭合测试语料库-2011-mrriandmstique
ROCStories与故事闭合测试语料库-2011-mrriandmstique 数据来源:互联网公开数据 标签:ROCStories,故事闭合测试,常识推理,叙事结构学习,故事理解,故事生成,日常事件,常识关系,语料库 数据概述: 本数据集包含ROCStories语料库,这是一个专门为故事闭合测试(Story Cloze... -
卡纳达语评论数据集KannadaReviewDataset-kishorsinnur
卡纳达语评论数据集KannadaReviewDataset-kishorsinnur 数据来源:互联网公开数据 标签:自然语言处理,卡纳达语,数据集,文本分析,情感分析,机器学习,多语言处理,语料库 数据概述:该数据集包含来自卡纳达语互联网平台的大量用户评论,记录了用户对各种产品,服务或内容的评价信息。主要特征如下:... -
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,语料库,双语数据,文本分析,人工智能,语言技术 数据概述: 该数据集包含越南语与德语的平行语料数据,记录了两种语言之间的对齐文本。主要特征如下:... -
爱尔兰古语与中古爱尔兰语语料库数据集-noahsullivan
爱尔兰古语与中古爱尔兰语语料库数据集-noahsullivan 数据来源:互联网公开数据 标签:语料库,古语,中古爱尔兰语,自然语言处理,词典,语言学,历史,文化,文本分析 数据概述: 本数据集为《爱尔兰古语与中古爱尔兰语语料库》(Corpus PalaeoHibernicum,... -
英语-印地语转换语料库数据集
英语-印地语转换语料库数据集 数据来源:互联网公开数据 标签:语料库, 语言转换, 英语, 印地语, 语言处理, 自然语言处理, 翻译模型, 音素脚本, 语言编码 数据概述:... -
COVID-19疫情研究论文多语言标注数据集-rebeccaburwei
COVID-19疫情研究论文多语言标注数据集-rebeccaburwei 数据来源:互联网公开数据 标签:COVID-19,新冠病毒,疫情,研究,论文,语言,多语言,标注,语料库,自然语言处理 数据概述:... -
英语-马拉雅拉姆语言翻译数据集-nihalthomas15
英语-马拉雅拉姆语言翻译数据集-nihalthomas15 数据来源:互联网公开数据 标签:英语,马拉雅拉姆,机器翻译,NLP,语料库,翻译,数据集,多语言 数据概述:... -
威尔士语词典语料库词汇及语境分析数据集-rtatman
威尔士语词典语料库词汇及语境分析数据集-rtatman 数据来源:互联网公开数据 标签:威尔士语,词典,语言学,语料库,词汇,语言分析,凯尔特语,翻译,双语,单语 数据概述:... -
索马里语文本语料库-清洗后句子数据集-hassen7
索马里语文本语料库-清洗后句子数据集-hassen7 数据来源:互联网公开数据 标签:索马里语,语言学,文本数据,自然语言处理,句子,清洗,语料库 数据概述:...