-
社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411
社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411 数据来源:互联网公开数据 标签:社交媒体,语言识别,数据集,文本分析,机器学习,自然语言处理,情感分析,西班牙语 数据概述:... -
语言检测数据集LanguageDetectionDataset-trinhtung
语言检测数据集LanguageDetectionDataset-trinhtung 数据来源:互联网公开数据 标签:语言检测,自然语言处理,数据集,文本分析,机器学习,人工智能,数据科学,语言学 数据概述: 该数据集包含来自多个来源的文本数据,用于语言检测任务。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2022年。 地理范围:... -
垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab
垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,数据集,机器学习,邮件过滤,文本分析,信息检索 数据概述:该数据集包含来自SpamAssassin项目的邮件数据,用于训练和测试垃圾邮件过滤系统。主要特征如下:... -
多语言翻译标签数据集TagsandTranslationDataset-outlook0
多语言翻译标签数据集TagsandTranslationDataset-outlook0 数据来源:互联网公开数据 标签:多语言翻译,数据集,标签管理,自然语言处理,机器翻译,文本分析,数据科学,信息处理 数据概述: 该数据集包含了来自多个来源的标签及其多语言翻译,适用于标签管理和多语言系统的构建。主要特征如下:... -
巴西高等法院STJ判决书与通行证数据集DiriasePassagensSTJ2025Dataset-matheus121
巴西高等法院STJ判决书与通行证数据集DiriasePassagensSTJ2025Dataset-matheus121 数据来源:互联网公开数据 标签:法律,司法,数据集,判决书,通行证,巴西,STJ,文本分析 数据概述: 该数据集包含了来自巴西高等法院(STJ)的判决书和通行证相关数据,旨在为法律研究和文本分析提供支持。主要特征如下:... -
自然语言处理数据集ANLP概览-ankitmakhija98
自然语言处理数据集ANLP概览-ankitmakhija98 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,NLP,语料库,语言模型,人工智能 数据概述: 该数据集汇总了各种自然语言处理(NLP)数据集,涵盖了文本分类,情感分析,机器翻译,文本生成,问答系统等多种NLP任务。主要特征如下: 时间跨度:... -
阿联酋航空客户评价数据集EmiratesAirlineCustomerReviewsDataset-ahmedelbashir99
阿联酋航空客户评价数据集EmiratesAirlineCustomerReviewsDataset-ahmedelbashir99 数据来源:互联网公开数据 标签:航空业,客户评价,数据集,文本分析,情感分析,机器学习,客户服务,数据挖掘 数据概述:该数据集包含来自阿联酋航空的乘客评价数据,记录了乘客对阿联酋航空服务的反馈和评价。主要特征如下:... -
藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx
藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx 数据来源:互联网公开数据 标签:藏文文献,命名实体识别,数据集,自然语言处理,机器学习,学术研究,文本分析,语言学 数据概述:该数据集包含来自藏文文献的引文数据,用于命名实体识别(NER)任务。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。... -
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,语言学,机器学习,信息检索 数据概述: 该数据集包含来自维基百科的法语语言内容,记录了多个领域的百科全书条目。主要特征如下:... -
立场检测数据集StanceDetectionDataset-ad6398
立场检测数据集StanceDetectionDataset-ad6398 数据来源:互联网公开数据 标签:立场检测,文本分析,自然语言处理,数据集,情感分析,观点挖掘,机器学习,舆情分析 数据概述: 该数据集包含用于立场检测任务的文本数据,旨在识别文本中对特定目标或主题的立场。主要特征如下:... -
新闻分类数据集NewsCategoryDataset-aishwaryamathala
新闻分类数据集NewsCategoryDataset-aishwaryamathala 数据来源:互联网公开数据 标签:新闻分类,数据集,机器学习,自然语言处理,文本分析,信息检索,媒体研究,文本挖掘 数据概述:该数据集包含来自多个新闻来源的新闻文章,记录了不同类别的新闻内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn
假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn 数据来源:互联网公开数据 标签:假新闻,新闻,文本分析,自然语言处理,机器学习,情感分析,信息检索,文本分类 数据概述: 该数据集来自假新闻挑战赛(Fake News Challenge,FNC-1),旨在促进假新闻的自动检测和识别。主要特征如下:... -
迈阿密商业新冠疫情安全提及数据集MiamiBusinessCOVIDSafetyMentionsDataset-basillabs
迈阿密商业新冠疫情安全提及数据集MiamiBusinessCOVIDSafetyMentionsDataset-basillabs 数据来源:互联网公开数据 标签:商业,新冠疫情,安全措施,提及,数据集,公共卫生,文本分析,健康安全 数据概述:... -
Lacuna分类提交数据集LacunaClassificationSubmissionsDataset-phantom50
Lacuna分类提交数据集LacunaClassificationSubmissionsDataset-phantom50 数据来源:互联网公开数据 标签:分类任务,机器学习,数据集,文本分析,自然语言处理,学术研究,数据科学,人工智能 数据概述: 该数据集包含来自Lacuna平台的分类任务提交数据,记录了用户对文本样本的分类结果。主要特征如下:... -
BBC新闻数据集BBCNewsDataset-waqarahmed163
BBC新闻数据集BBCNewsDataset-waqarahmed163 数据来源:互联网公开数据 标签:BBC新闻,数据集,文本分析,自然语言处理,机器学习,新闻分类,信息提取,文本挖掘 数据概述:该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。... -
纽约租赁房产咨询数据集NewYorkRentalListingEnquiriesDataset-diwas13
纽约租赁房产咨询数据集NewYorkRentalListingEnquiriesDataset-diwas13 数据来源:互联网公开数据 标签:房地产,租赁,数据集,咨询,自然语言处理,机器学习,文本分析,纽约 数据概述: 该数据集包含来自纽约租赁房产的咨询数据,记录了租房者与房产经纪人之间的互动信息。主要特征如下:... -
电影类型预测数据集-abhikdhar
电影类型预测数据集-abhikdhar 数据来源:互联网公开数据 标签:电影,类型,预测,数据集,机器学习,自然语言处理,文本分析,娱乐,影评 数据概述: 该数据集包含电影相关的文本数据,旨在用于电影类型的预测任务。主要特征如下: 时间跨度:数据涵盖了不同年份上映的电影。 地理范围:数据主要来源于全球范围内的电影。... -
推文训练数据集Tweets-TrainDataset-priyankacheruku
推文训练数据集Tweets-TrainDataset-priyankacheruku 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,自然语言处理,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的文本内容和相关情感标签。主要特征如下:... -
讯飞农业领域数据集-xuyatian
讯飞农业领域数据集-xuyatian 数据来源:互联网公开数据 标签:农业,数据集,自然语言处理,人工智能,文本分析,农业科技,信息抽取,命名实体识别 数据概述:该数据集包含来自讯飞公开的农业领域相关数据,涵盖了农业领域的技术文档,新闻报道,专家访谈,学术论文等多种文本类型。主要特征如下:... -
H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej
H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej 数据来源:互联网公开数据 标签:时尚,零售,产品,文章,数据集,文本分析,自然语言处理,推荐系统 数据概述: 该数据集包含 H&M 集团的产品文章数据,记录了 H&M 集团发布的关于服装和其他产品的文章信息。主要特征如下:...