-
医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa
医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa 数据来源:互联网公开数据 标签:医学,摘要,文本分类,自然语言处理,机器学习,医疗健康,语料库,医学文献 数据概述: 该数据集包含来自医学文献的摘要文本,用于文本分类任务。主要特征如下:... -
尼泊尔新闻文章摘要数据集-adarsh203
尼泊尔新闻文章摘要数据集-adarsh203 数据来源:互联网公开数据 标签:新闻文章,摘要,尼泊尔,自然语言处理,文本分析,机器学习,文本摘要,语料库 数据概述: 该数据集包含了尼泊尔新闻文章及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于文章的发布时间。 地理范围:数据主要涵盖尼泊尔地区的新闻报道。... -
数据5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01
5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01 数据来源:互联网公开数据 标签:语料库,句法分析,依存句法,数据集,自然语言处理,人工智能,语言学,计算机科学... -
乌尔都语文本词频统计数据集-乌尔都语文本语料库
乌尔都语文本词频统计数据集-乌尔都语文本语料库 数据来源:互联网公开数据 标签:乌尔都语,文本分析,自然语言处理,词频统计,语料库,语言学,N-gram 数据概述: 本数据集基于在线报纸和书籍的抓取构建的乌尔都语语料库,包含了不同长度的N-gram及其对应的出现频率。数据文件包括:... -
英语语言文本数据集LanguageDataDataset-danruan
英语语言文本数据集LanguageDataDataset-danruan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言学,机器学习,文本挖掘,英语,语料库 数据概述: 该数据集包含来自多种来源的英语文本数据,记录了不同类型的英语文本内容。主要特征如下:... -
文化遗产文本情感分析数据集-raghadsaeed
文化遗产文本情感分析数据集-raghadsaeed 数据来源:互联网公开数据 标签:文化遗产,文本分析,情感分析,自然语言处理,机器学习,文化研究,语料库,情感标注 数据概述:该数据集包含来自互联网的文化遗产相关文本,主要用于情感分析研究。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期和不同来源的文化遗产相关文本。... -
印地语语流中断数据集HindiDisfluencyDataset-daspinaki
印地语语流中断数据集HindiDisfluencyDataset-daspinaki 数据来源:互联网公开数据 标签:语言处理,语料库,数据分析,语音识别,自然语言处理,机器学习,语言学,印地语 数据概述: 该数据集包含来自印地语的语流中断语音和文本数据,记录了印地语语音中的中断,重复,修正等非流畅现象。主要特征如下:... -
英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang
英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang 数据来源:互联网公开数据 标签:英语教学,语料库,语言研究,数据集,教育技术,自然语言处理,翻译研究,学术资源 数据概述: 该数据集包含来自Onestopenglish网站的英语教学语料库,记录了英语教学相关的文本内容。主要特征如下:... -
达里贾语开放数据集DarijaOpenDataset-youneselbouknify
达里贾语开放数据集DarijaOpenDataset-youneselbouknify 数据来源:互联网公开数据 标签:达里贾语,语言数据,自然语言处理,数据集,语料库,人工智能,机器学习,语言学 数据概述:该数据集包含来自不同来源的达里贾语(摩洛哥阿拉伯语方言)文本数据,记录了日常对话,新闻报道,社交媒体帖子等多种类型的文本内容。主要特征如下:... -
路透社新闻文章分类数据集Reuters-21578ArticleClassificationDataset-mateuszkrasinski9
路透社新闻文章分类数据集Reuters-21578ArticleClassificationDataset-mateuszkrasinski9 数据来源:互联网公开数据 标签:新闻文本,文本分类,机器学习,自然语言处理,数据集,信息检索,语料库,路透社 数据概述: 该数据集包含来自路透社的新闻文章,主要用于文本分类任务。主要特征如下:... -
英语-豪萨语翻译语料库数据集English-HausaTranslationCorpusDataset-gigikenneth
英语-豪萨语翻译语料库数据集English-HausaTranslationCorpusDataset-gigikenneth 数据来源:互联网公开数据 标签:语言翻译,语料库,自然语言处理,多语言,机器翻译,文本分析,语言资源,人工智能 数据概述: 该数据集包含来自英语到豪萨语的平行语料,记录了双语文本对,适用于机器翻译和语言学研究。主要特征如下:... -
日常对话情绪刺激语料库DailyDialogEmotionStimulusISEAR数据集-fadjar
日常对话情绪刺激语料库DailyDialogEmotionStimulusISEAR数据集-fadjar 数据来源:互联网公开数据 标签:日常对话,情绪分析,语料库,数据集,自然语言处理,机器学习,情感识别,心理学 数据概述:... -
-
英语学习文本数据集en-train-csv-elguapo
英语学习文本数据集en-train-csv-elguapo 数据来源:互联网公开数据 标签:英语学习,文本数据,自然语言处理,语言模型,数据集,语料库,机器学习,文本分析 数据概述: 该数据集包含了用于英语学习的文本数据,记录了大量的英语句子,段落及文章。主要特征如下: 时间跨度: 数据记录的时间范围不固定,涵盖了不同时期的英语文本。 地理范围:... -
命名实体识别标注语料库数据集-endofnight17j03
命名实体识别标注语料库数据集-endofnight17j03 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,语料库,信息抽取,标注数据 数据概述:该数据集包含用于命名实体识别(NER)任务的标注语料,记录了文本中各种命名实体的详细信息。主要特征如下:... -
创意写作文本清洗数据集-mohamednafea01
创意写作文本清洗数据集-mohamednafea01 数据来源:互联网公开数据 标签:文本数据,创意写作,数据清洗,自然语言处理,文本分析,语料库,机器学习,NLP 数据概述: 该数据集包含经过清洗的创意写作文本,旨在为自然语言处理和文本分析任务提供高质量的语料库。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和类型的创意写作文本。... -
保罗-科埃略炼金术士小说文本数据集-stealthtechnologies
保罗-科埃略炼金术士小说文本数据集-stealthtechnologies 数据来源:互联网公开数据 标签:小说,文学,文本分析,数据集,阅读理解,情感分析,自然语言处理,语料库 数据概述: 该数据集包含保罗·科埃略创作的小说《炼金术士》的文本数据,记录了小说的完整内容。主要特征如下: 时间跨度:数据记录的时间范围为小说创作出版至今。... -
情感与主题分析数据集SentimentandTopicAnalysisDataset-yojn710
情感与主题分析数据集SentimentandTopicAnalysisDataset-yojn710 数据来源:互联网公开数据 标签:情感分析,主题建模,数据集,文本挖掘,机器学习,自然语言处理,数据科学,语料库 数据概述: 该数据集包含约30,000条文本记录,涵盖了不同来源的文本内容,旨在用于情感和主题分析。主要特征如下:... -
希伯来文化平台科技文化视角多语言平行文本数据集
希伯来文化平台科技文化视角多语言平行文本数据集 数据来源:互联网公开数据 标签:平行文本,多语言,希伯来语,文化,科技,HTML,文本挖掘,机器翻译,语料库 数据概述: 本数据集收录了来自以色列领先的希伯来文化平台Hitdarderut... -
柯勒律治诗歌伪标签数据集ColeridgePseudo-LabelsDataset-chienhsianghung
柯勒律治诗歌伪标签数据集ColeridgePseudo-LabelsDataset-chienhsianghung 数据来源:互联网公开数据 标签:诗歌,文本分析,自然语言处理,伪标签,机器学习,情感分析,诗歌风格,语料库 数据概述: 该数据集包含由柯勒律治诗歌生成的伪标签数据,旨在用于训练文本分析和自然语言处理模型。主要特征如下:...