-
anno-data标注数据集Anno-DataLabelingDataset-naumangujjar26
anno-data标注数据集Anno-DataLabelingDataset-naumangujjar26 数据来源:互联网公开数据 标签:标注数据,数据集,机器学习,数据挖掘,人工智能,自然语言处理,图像识别,计算机视觉 数据概述: 该数据集包含来自anno-data平台的标注数据,记录了各类数据样本的标注信息。主要特征如下:... -
CommonLit英语文章摘要数据集-artisusxiren
CommonLit英语文章摘要数据集-artisusxiren 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,英语学习,机器翻译,文本分析,语言模型,教育 数据概述: 该数据集包含来自CommonLit平台提供的英语文章摘要数据,旨在用于文本摘要,自然语言处理和英语学习相关的研究。主要特征如下:... -
家得宝商品搜索关键词数据集HomeDepotSearchKeywordsDataset-riteshpatil8998
家得宝商品搜索关键词数据集HomeDepotSearchKeywordsDataset-riteshpatil8998 数据来源:互联网公开数据 标签:零售业,搜索关键词,数据集,自然语言处理,文本挖掘,机器学习,消费者行为,市场分析 数据概述: 该数据集包含来自家得宝(Home... -
巴基斯坦推特推文数据集PakistanTweetsDataset-umarfarooq45
巴基斯坦推特推文数据集PakistanTweetsDataset-umarfarooq45 数据来源:互联网公开数据 标签:社交媒体,推特,文本分析,巴基斯坦,自然语言处理,情感分析,社会学,舆情分析 数据概述: 该数据集包含了来自巴基斯坦地区的推特推文数据,记录了用户在推特平台上的公开言论。主要特征如下:... -
检索公共测试数据集-nhutchung
检索公共测试数据集-nhutchung 数据来源:互联网公开数据 标签:信息检索,数据集,文本分析,机器学习,自然语言处理,搜索,评估,测试 数据概述: 该数据集包含用于信息检索任务的公开测试数据,记录了检索系统性能的评估指标。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集的发布时间。... -
HackerNews网站文章数据集HackerNewsArticlesDataset-farapopoola
HackerNews网站文章数据集HackerNewsArticlesDataset-farapopoola 数据来源:互联网公开数据 标签:Hacker News,新闻,社交媒体,数据分析,自然语言处理,文本挖掘,机器学习,网络社区 数据概述: 该数据集包含来自Hacker News网站的文章数据,记录了Hacker... -
自然语言处理与灾难推文数据集NLPwithDisasterTweetsCleanedData-phchen5
自然语言处理与灾难推文数据集NLPwithDisasterTweetsCleanedData-phchen5 数据来源:互联网公开数据 标签:自然语言处理,灾难推文,数据集,文本分类,情感分析,机器学习,社交媒体,应急管理 数据概述: 该数据集包含了来自推特(Twitter)的推文数据,这些推文与各种灾难事件相关。主要特征如下:... -
命名实体识别原始数据集NamedEntityRecognitionRawDataDataset-kiruthigaa
命名实体识别原始数据集NamedEntityRecognitionRawDataDataset-kiruthigaa 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本分析,机器学习,人工智能,语言学,文本挖掘 数据概述:该数据集包含来自多个来源的原始文本数据,记录了用于命名实体识别的任务。主要特征如下:... -
文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai
文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai 数据来源:互联网公开数据 标签:文本处理,TF-IDF,数据集,自然语言处理,特征提取,机器学习,信息检索,文本分析 数据概述: 该数据集专注于文本编码与TF-IDF(词频-逆文档频率)权重计算,记录了文本数据经过处理后的特征向量。主要特征如下:... -
西班牙政治推特语料库2023-ricardomoya
西班牙政治推特语料库2023-ricardomoya 数据来源:互联网公开数据 标签:推特,政治,西班牙,自然语言处理,NLP,机器学习,PSOE,PP,VOX,Unidas Podemos,Ciudadanos 数据概述: 本数据集包含来自西班牙主要政党(PSOE, PP, VOX, Unidas Podemos 和... -
德里推特数据集DelhiTweetsDataset-mlcovidresearch
德里推特数据集DelhiTweetsDataset-mlcovidresearch 数据来源:互联网公开数据 标签:推特数据,社交媒体,数据分析,自然语言处理,城市研究,社会学,情感分析,机器学习 数据概述:该数据集包含来自德里的推特数据,记录了德里居民在社交媒体平台上的讨论和活动。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。... -
法国财经新闻与股票市场情绪分析预测数据集-2018年11月至2021年3月-arcticgiant
法国财经新闻与股票市场情绪分析预测数据集-2018年11月至2021年3月-arcticgiant 数据来源:互联网公开数据 标签:财经新闻,法国,股票市场,情绪分析,CAC40,预测,自然语言处理,时间序列,VADER,翻译 数据概述:... -
数据2021年5月Job-A-Thon竞赛数据集-makrovh
2021年5月Job-A-Thon竞赛数据集-makrovh 数据来源:互联网公开数据 标签:招聘,求职,数据集,机器学习,自然语言处理,文本分析,预测模型,人才市场 数据概述: 该数据集包含了2021年5月Job-A-Thon竞赛的相关数据,主要记录了招聘和求职信息,旨在用于构建预测模型。主要特征如下:... -
斯瓦希里语语音数据集SwahiliTrainSplitDataset-rainmaker29
斯瓦希里语语音数据集SwahiliTrainSplitDataset-rainmaker29 数据来源:互联网公开数据 标签:斯瓦希里语,语音识别,数据集,自然语言处理,机器学习,语音技术,人工智能,语言学 数据概述: 该数据集包含来自互联网公开的斯瓦希里语语音数据,主要用于语音识别和自然语言处理的研究。主要特征如下:... -
英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong
英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,文本分类,机器学习,情感分析,社交媒体,文本数据,数据集 数据概述: 该数据集包含了英语社交媒体平台上的文本数据,旨在用于仇恨言论的检测和分析。主要特征如下: 时间跨度:... -
意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli
意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli 数据来源:互联网公开数据 标签:讽刺检测,自然语言处理,数据集,机器学习,文本分析,社交媒体,人工智能 数据概述:该数据集包含来自意大利社交媒体平台的数据,记录了用户发布的评论及其是否为讽刺的判断结果。主要特征如下:... -
情感分析比赛数据集IsemevalDataset-adityaraghuvanshi999
情感分析比赛数据集IsemevalDataset-adityaraghuvanshi999 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,社交媒体,学术研究,信息检索 数据概述:该数据集来自情感分析比赛,主要记录了社交媒体上的文本数据及其对应的情感标签,适用于情感分析,自然语言处理等任务。主要特征如下:... -
互联网新闻摘要数据集HSXLNETSummaryDataset-gayatriilan
互联网新闻摘要数据集HSXLNETSummaryDataset-gayatriilan 数据来源:互联网公开数据 标签:新闻摘要,数据集,自然语言处理,文本分析,机器学习,信息检索,媒体研究,互联网新闻 数据概述: 该数据集包含来自互联网新闻网站的新闻文章及其对应的摘要,适用于新闻摘要生成,文本摘要技术研究等任务。主要特征如下:... -
美国航空业情感分析数据集USAirlineSentimentsDataset-levii2375
美国航空业情感分析数据集USAirlineSentimentsDataset-levii2375 数据来源:互联网公开数据 标签:航空业,情感分析,数据集,社交媒体,自然语言处理,客户反馈,市场研究,社会媒体分析 数据概述:该数据集包含来自推特的关于美国各大航空公司客户评论的数据,记录了客户对航空公司服务的情感评价。主要特征如下:... -
电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-devaanshpuri
电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-devaanshpuri 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,信息安全,数据分析 数据概述: 该数据集包含来自电子邮件系统的邮件数据,记录了邮件的分类标签和内容特征。主要特征如下:...