-
简化虚假新闻数据集
简化虚假新闻数据集 数据来源:互联网公开数据 标签:虚假新闻,文本分类,NLP,二分类问题,数据清洗,特征提取,新闻真实性分析 数据概述: 本数据集是虚假新闻与真实新闻数据集的简化版本,旨在为文本分类任务提供训练集。数据集已标注,包含真实新闻与虚假新闻的文本内容,适合作为自然语言处理(NLP)任务的基础数据。数据集经过初步处理,确保数据质量与一致性。... -
虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran
虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran 数据来源:互联网公开数据 标签:新闻,虚假信息,自然语言处理,文本分类,机器学习,情感分析,社交媒体,信息安全 数据概述: 该数据集包含经过预处理并使用GloVe词嵌入的虚假新闻检测数据,记录了新闻文章的文本内容及其真实性标签。主要特征如下:... -
孟加拉语仇恨言论与俚语数据集-arkabhattachajee01
孟加拉语仇恨言论与俚语数据集-arkabhattachajee01 数据来源:互联网公开数据 标签:仇恨言论,俚语,孟加拉语,自然语言处理,文本分类,情感分析,社交媒体,语言学 数据概述: 该数据集包含了孟加拉语社交媒体上的仇恨言论,其中部分言论使用了俚语。主要特征如下: 时间跨度:数据记录的时间范围未知,但通常反映了社交媒体上的近期言论。... -
英国广播公司BBC新闻文本数据集BBCNewsTextDataset-krishnaprasad2608
英国广播公司BBC新闻文本数据集BBCNewsTextDataset-krishnaprasad2608 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,机器学习,文本分类,信息检索,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本,涵盖多个新闻类别。主要特征如下:... -
合同条款分析数据集CUAD-Master-ClausesDataset-akashrai1701
合同条款分析数据集CUAD-Master-ClausesDataset-akashrai1701 数据来源:互联网公开数据 标签:法律文本,合同分析,数据集,自然语言处理,机器学习,法律研究,文本分类,智能合约 数据概述: 该数据集包含来自 CUAD(Contract Understanding... -
多标签英语和孟加拉语评论数据集Multi-labeledEnglishandBanglaCommentsDataset-sanzidasiddike
多标签英语和孟加拉语评论数据集Multi-labeledEnglishandBanglaCommentsDataset-sanzidasiddike 数据来源:互联网公开数据 标签:自然语言处理,多语言,数据集,情感分析,机器学习,文本分类,情感识别,语言处理 数据概述:... -
情绪识别不平衡数据集V26-EmotionImbalancedDatasetV2-rahulshelke98
情绪识别不平衡数据集V26-EmotionImbalancedDatasetV2-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,数据集,情感分析,机器学习,自然语言处理,文本分类,情感不平衡,多类别分类 数据概述: 该数据集是用于情绪识别任务的文本数据集,重点关注情感类别的不平衡问题。主要特征如下: 时间跨度:... -
政治虚假新闻检测数据集2017
政治虚假新闻检测数据集2017 数据来源:互联网公开数据 标签:虚假新闻,政治,文本分类,机器学习,n-gram分析,数据预处理,意见 spam 数据概述: 本数据集整合了“liar liar pants on... -
社交媒体种族歧视言论数据集RacistCommentsDataset-gilchristmiguel
社交媒体种族歧视言论数据集RacistCommentsDataset-gilchristmiguel 数据来源:互联网公开数据 标签:种族歧视,言论分析,自然语言处理,数据集,文本分类,情感分析,社交媒体,人工智能 数据概述: 该数据集包含来自社交媒体平台的种族歧视言论数据,旨在用于研究和分析种族歧视言论的识别与处理。主要特征如下:... -
自然语言处理作业三测试数据集-hangman1998
自然语言处理作业三测试数据集-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器翻译,文本生成,深度学习,NLP 数据概述:该数据集包含了多个用于自然语言处理任务的测试数据,旨在评估和验证NLP模型的效果。主要特征如下: 时间跨度:数据收集时间不限,涵盖不同年份的文本数据。... -
推文情感分析数据集TweetSentimentAnalysisDataset-itoeiji
推文情感分析数据集TweetSentimentAnalysisDataset-itoeiji 数据来源:互联网公开数据 标签:情感分析,数据集,社交媒体,机器学习,自然语言处理,文本分类,数据挖掘,人工智能 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的内容及其情感倾向。主要特征如下:... -
垃圾邮件与正常邮件分类数据集-邮件内容与标签-israkhasanjone
垃圾邮件与正常邮件分类数据集-邮件内容与标签-israkhasanjone 数据来源:互联网公开数据 标签:邮件,垃圾邮件,正常邮件,文本分类,自然语言处理,机器学习,文本数据 数据概述:... -
数据2020天池NLP中文文本分类竞赛数据集-jt120lz
2020天池NLP中文文本分类竞赛数据集-jt120lz 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,中文,NLP竞赛,情感分析,语义理解 数据概述: 该数据集来自2020年天池平台举办的NLP(自然语言处理)中文文本分类竞赛,记录了中文文本数据及其对应的类别标签。主要特征如下:... -
土耳其语Twitter平台社交媒体攻击性语言检测数据集-eymaahner
土耳其语Twitter平台社交媒体攻击性语言检测数据集-eymaahner 数据来源:互联网公开数据 标签:土耳其语, Twitter, 社交媒体, 攻击性语言, 情感分析, 自然语言处理, 文本分类, 机器学习 数据概述:... -
孟加拉语虚假新闻分类数据集-hakim11
孟加拉语虚假新闻分类数据集-hakim11 数据来源:互联网公开数据 标签:虚假新闻,孟加拉语,自然语言处理,文本分类,机器学习,新闻分析,语言学,情感分析 数据概述:该数据集包含孟加拉语的虚假新闻文本,用于进行虚假新闻的检测与分类。主要特征如下: 时间跨度:数据收集的时间范围不明确,但包含了近期发布的新闻。... -
印地语细粒度情感文本数据集EMOHI58KFine-grainedHindiEmotionDataText-debadityashome
印地语细粒度情感文本数据集EMOHI58KFine-grainedHindiEmotionDataText-debadityashome 数据来源:互联网公开数据 标签:情感分析,印地语,数据集,自然语言处理,文本分类,情感识别,机器学习,多语言处理 数据概述: 该数据集包含来自公开来源的印地语文本数据,记录了不同情感的文本表达。主要特征如下:... -
电影评论数据集50000条评论MovieReviewDataset50000Rows-kunaljcdu
电影评论数据集50000条评论MovieReviewDataset50000Rows-kunaljcdu 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,情感分析,机器学习,文本挖掘,文本分类,文化研究 数据概述:该数据集包含50000条电影评论,记录了观众对电影的详细评论内容及情感评分。主要特征如下:... -
BBC新闻自然语言处理数据集BBCNewsNLPDataset-weslatimarwen
BBC新闻自然语言处理数据集BBCNewsNLPDataset-weslatimarwen 数据来源:互联网公开数据 标签:新闻分析,自然语言处理,数据集,文本分类,机器学习,信息提取,语言模型,数据挖掘 数据概述: 该数据集包含来自BBC新闻的文本数据,记录了新闻文章的标题,内容,分类标签等信息。主要特征如下:... -
深度学习模型训练数据SubmissionTrainEpoch10-ryosukeozaki
深度学习模型训练数据SubmissionTrainEpoch10-ryosukeozaki 数据来源:互联网公开数据 标签:深度学习,模型训练,数据集,文本分类,自然语言处理,机器学习,数据分析,神经网络 数据概述: 该数据集包含用于深度学习模型训练的文本数据,记录了模型在训练过程中的数据表现。主要特征如下:... -
印度2019大选期间政党推文情感分析数据集-rishabhvyas
印度2019大选期间政党推文情感分析数据集-rishabhvyas 数据来源:互联网公开数据 标签:印度选举,推文,情感分析,BJP,国大党,数据预处理,机器学习,文本分类,自然语言处理 数据概述: 本数据集包含2019年印度大选期间与印度两大主要政党BJP(印度人民党)和国大党相关的推文。这些推文通过Twitter...