-
中国歌曲歌词数据集ChineseSongLyricsDataset-jyesawtellrickson
中国歌曲歌词数据集ChineseSongLyricsDataset-jyesawtellrickson 数据来源:互联网公开数据 标签:音乐,歌词,数据集,自然语言处理,文本分析,情感分析,机器学习,文化研究 数据概述: 该数据集包含来自中国音乐平台和公开歌词库的歌曲歌词数据,记录了各类中文歌曲的歌词内容。主要特征如下:... -
文章主题数据集ArticleTopicDataset-bhavyarajsinhzala
文章主题数据集ArticleTopicDataset-bhavyarajsinhzala 数据来源:互联网公开数据 标签:文本分析,主题分类,数据集,自然语言处理,机器学习,信息提取,内容分析,学术研究 数据概述: 该数据集包含来自互联网公开渠道的文章主题数据,记录了各类文章的主题分类信息。主要特征如下:... -
手机评分预测数据集-klmsathish
手机评分预测数据集-klmsathish 数据来源:互联网公开数据 标签:手机,评分预测,数据集,机器学习,自然语言处理,文本分析,用户评价,产品分析 数据概述:该数据集包含来自多个来源的手机用户评价数据,旨在用于手机评分预测任务。主要特征如下: 时间跨度:数据记录的时间范围不详,但涵盖了多个手机型号和发布时间。... -
Twitter推文数据集TwitterTweetDataDataset-pratikpujarichef
Twitter推文数据集TwitterTweetDataDataset-pratikpujarichef 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,情感分析,机器学习,自然语言处理,大数据,舆情监测 数据概述: 该数据集包含来自Twitter平台的大量推文数据,记录了用户发布的推文内容及相关信息。主要特征如下:... -
推特社交媒体文本分析数据集TwitterDataAnalysisNLPDataset-tanmayb8055
推特社交媒体文本分析数据集TwitterDataAnalysisNLPDataset-tanmayb8055 数据来源:互联网公开数据 标签:社交媒体,推特,文本分析,自然语言处理,情感分析,数据挖掘,机器学习,舆情分析 数据概述: 该数据集包含来自推特(Twitter)平台的公开数据,记录了用户发布的推文文本信息。主要特征如下:... -
孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas
孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,语言技术,机器学习,文本分析,人工智能,多语言处理 数据概述: 该数据集专注于孟加拉语的命名实体识别(NER),包含了大量标注好的孟加拉语文本数据。主要特征如下:... -
虚假新闻数据集预处理后FakeNewsDataAfterPreprocessing-ngthaoo
虚假新闻数据集预处理后FakeNewsDataAfterPreprocessing-ngthaoo 数据来源:互联网公开数据 标签:虚假新闻,数据集,文本分析,自然语言处理,机器学习,信息验证,新闻传播,社会研究 数据概述: 该数据集包含经过预处理的虚假新闻数据,记录了不同来源的虚假新闻文章及其相关信息。主要特征如下:... -
植物病害诊断对话数据集-rahulrwl
植物病害诊断对话数据集-rahulrwl 数据来源:互联网公开数据 标签:植物病害,诊断,对话,自然语言处理,机器学习,农业,疾病识别,文本分析 数据概述: 该数据集包含植物病害诊断相关的对话记录,记录了用户与诊断系统之间的互动。主要特征如下: 时间跨度: 数据记录的时间范围为不确定,取决于对话的收集时间。 地理范围:... -
负面评论数据集NegativeCommentsDataset-yuzhe2020
负面评论数据集NegativeCommentsDataset-yuzhe2020 数据来源:互联网公开数据 标签:文本分析,情感分析,数据集,自然语言处理,机器学习,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自互联网的负面评论数据,记录了用户在社交媒体,电商平台等平台上的负面评价信息。主要特征如下:... -
多语言问答系统印地语数据集MLQA印地语数据集-ashwinvijayanpillai
多语言问答系统印地语数据集MLQA印地语数据集-ashwinvijayanpillai 数据来源:互联网公开数据 标签:多语言问答,印地语,数据集,自然语言处理,机器学习,文本分析,问答系统,语言技术 数据概述: 该数据集包含来自多语言问答系统(MLQA)的印地语数据,记录了包含问题和对应答案的问答对。主要特征如下:... -
法律文章分析数据集LegalArticlesDataset-saidgrich
法律文章分析数据集LegalArticlesDataset-saidgrich 数据来源:互联网公开数据 标签:法律文章,数据集,文本分析,法学研究,自然语言处理,法律咨询,法律知识,法律教育 数据概述: 该数据集包含来自多个法律网站和法律数据库的法律文章数据,记录了各类法律文件,案例分析和法律评论等详细信息。主要特征如下:... -
Gojek用户评论情感分析数据集GojekUserReviewSentimentAnalysisDataset-ahmdfkhr3
Gojek用户评论情感分析数据集GojekUserReviewSentimentAnalysisDataset-ahmdfkhr3 数据来源:互联网公开数据 标签:情感分析,用户评论,数据集,自然语言处理,机器学习,文本分析,市场研究,客户反馈 数据概述:... -
网络欺凌检测数据集CyberBullyingDetectionDataset-ali12rz
网络欺凌检测数据集CyberBullyingDetectionDataset-ali12rz 数据来源:互联网公开数据 标签:网络欺凌,数据集,文本分析,社交媒体,机器学习,自然语言处理,数据分析,社会研究 数据概述:该数据集包含来自社交媒体平台的文本数据,记录了用户之间的互动,特别是涉及网络欺凌的评论和消息。主要特征如下:... -
维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv
维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,信息检索,机器学习,文本分析,知识图谱,深度学习 数据概述: 该数据集结合了维基百科和MS MARCO的数据,记录了大量的问答对和相关信息检索结果。主要特征如下:... -
IMDB电影评论数据集IMDBMovieReviewsDataset-fernarancibia
IMDB电影评论数据集IMDBMovieReviewsDataset-fernarancibia 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,数据集,文本分析,机器学习,影评 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,记录了用户对电影的评价和评论内容。主要特征如下:... -
巴西歌曲歌词数据集BrazilianSongsLyricsDataset-jorgefjr
巴西歌曲歌词数据集BrazilianSongsLyricsDataset-jorgefjr 数据来源:互联网公开数据 标签:巴西音乐,歌词,数据集,文本分析,自然语言处理,文化研究,音乐研究,诗歌分析 数据概述:该数据集包含来自巴西的歌曲歌词数据,记录了不同年代,风格和语言的巴西歌曲歌词。主要特征如下:... -
电影信息聊天机器人数据集-vantanle71
电影信息聊天机器人数据集-vantanle71 数据来源:互联网公开数据 标签:电影,数据集,聊天机器人,自然语言处理,情感分析,推荐系统,电影评论,文本分析 数据概述: 该数据集包含电影的详细信息,旨在用于构建电影信息聊天机器人。主要特征如下: 时间跨度: 数据涵盖了从电影上映至今的电影数据。 地理范围: 数据主要来源于全球范围内的电影信息。... -
法律领域命名实体识别数据集-pratikpujarichef
法律领域命名实体识别数据集-pratikpujarichef 数据来源:互联网公开数据 标签:命名实体识别,法律,自然语言处理,文本分析,数据集,机器学习,司法,合同 数据概述: 该数据集包含从法律文本中提取的命名实体数据,旨在用于法律领域的命名实体识别(NER)任务。主要特征如下: 时间跨度:数据覆盖的时间范围不限,主要取决于收集到的法律文本的时间。... -
消费者情感分析电商数据集SentimentAnalysisE-commerceDataset-rabbyshajinislam
消费者情感分析电商数据集SentimentAnalysisE-commerceDataset-rabbyshajinislam 数据来源:互联网公开数据 标签:情感分析,电商,数据集,自然语言处理,机器学习,消费者行为,文本分析,商业智能 数据概述: 该数据集包含来自电商平台的消费者评论数据,记录了用户对商品的情感倾向和评价。主要特征如下:... -
垃圾短信检测数据集SMSSpamDataset-hanzvivatma
垃圾短信检测数据集SMSSpamDataset-hanzvivatma 数据来源:互联网公开数据 标签:文本分类,垃圾短信,自然语言处理,机器学习,数据集,短信,NLP,文本分析 数据概述: 该数据集包含了大量短信文本数据,用于垃圾短信的检测与识别。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但涵盖了短信内容在一定时间内的收集。 地理范围:...