-
网络欺凌预测数据集平衡版CyberbullyingPredictionDatasetBalanced-sanzidasiddike3633
网络欺凌预测数据集平衡版CyberbullyingPredictionDatasetBalanced-sanzidasiddike3633 数据来源:互联网公开数据 标签:网络欺凌,数据集,预测分析,机器学习,社交媒体,文本分析,情感分析,社会研究 数据概述: 该数据集是为网络欺凌预测研究设计的平衡数据集,包含来自社交媒体平台的文本数据。主要特征如下:... -
英语到阿坎特语单词翻译数据集English-to-Akan-Twi-WordsDataset-derrickzhen
英语到阿坎特语单词翻译数据集English-to-Akan-Twi-WordsDataset-derrickzhen 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,多语言,机器学习,文本分析,语言学习,翻译技术 数据概述: 该数据集包含来自英语到阿坎特语(Twi)的单词翻译记录,记录了两个语言之间的词汇对应关系。主要特征如下:... -
新闻杂志分类数据集NewsMagazineClassifierDataset-rushikeshhiray
新闻杂志分类数据集NewsMagazineClassifierDataset-rushikeshhiray 数据来源:互联网公开数据 标签:新闻分类,数据集,文本挖掘,自然语言处理,机器学习,新闻媒体,信息检索,文本分析 数据概述: 该数据集包含来自多个新闻和杂志来源的文章数据,记录了不同类别新闻和杂志文章的内容信息。主要特征如下:... -
语法修正数据集GrammarCorrectionDataDataset-uwelcomem
语法修正数据集GrammarCorrectionDataDataset-uwelcomem 数据来源:互联网公开数据 标签:自然语言处理,语法修正,数据集,机器学习,语言模型,文本分析,人工智能,语言技术 数据概述:该数据集包含来自互联网公开来源的语法修正数据,记录了原始文本及其对应的修正文本。主要特征如下: 时间跨度:数据记录的时间范围为近年。... -
文本中的图形数据集GraphsinTextDataset-ghanender
文本中的图形数据集GraphsinTextDataset-ghanender 数据来源:互联网公开数据 标签:自然语言处理,图形识别,数据集,文本分析,机器学习,模式识别,信息提取,计算机视觉 数据概述: 该数据集包含来自多个文本来源的数据,记录了文本中出现的图形及其相关信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
命名实体识别数据集NER-meharihailemariam
命名实体识别数据集NER-meharihailemariam 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,信息抽取,语言学,文本标注 数据概述: 该数据集包含用于命名实体识别(NER)任务的文本数据,记录了文本中各种命名实体的详细信息。主要特征如下: 时间跨度:... -
语法修正说服文本数据集Grammar-CorrectedPersuasiveTextDataset2023-defdet
语法修正说服文本数据集Grammar-CorrectedPersuasiveTextDataset2023-defdet 数据来源:互联网公开数据 标签:语法修正,说服文本,自然语言处理,文本分析,机器学习,语言学,数据集,文本生成 数据概述: 该数据集包含经过语法修正的说服性文本数据,适用于自然语言处理和文本生成等任务。主要特征如下:... -
国际老虎日推文数据集InternationalTigerDayTweetsDataset-shaz13
国际老虎日推文数据集InternationalTigerDayTweetsDataset-shaz13 数据来源:互联网公开数据 标签:社交媒体,推文,老虎,保护,动物,自然,文本分析,舆情分析 数据概述: 该数据集包含来自Twitter的推文数据,记录了与国际老虎日相关的讨论和信息。主要特征如下:... -
有害言论检测数据集ToxicSemEvalData-izuna385
有害言论检测数据集ToxicSemEvalData-izuna385 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器学习,有害内容检测,社交媒体,文本分析 数据概述: 该数据集包含来自 SemEval 2017 竞赛的数据,主要用于有害言论的检测与分类。主要特征如下: 时间跨度:数据记录的时间范围为 SemEval... -
土耳其TRT新闻雅安新闻数据集TRTHaberYAAMNewsDataset-denizhanahin
土耳其TRT新闻雅安新闻数据集TRTHaberYAAMNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻,土耳其,雅安,数据集,文本分析,自然语言处理,事件报道,媒体研究 数据概述:... -
哈利波特书籍角色数据集HarryPotterBookCharacterDataset-parvanehfaraji
哈利波特书籍角色数据集HarryPotterBookCharacterDataset-parvanehfaraji 数据来源:互联网公开数据 标签:文学,角色分析,数据集,哈利波特,数据挖掘,文本分析,书籍研究,角色识别 数据概述: 该数据集包含来自《哈利波特》系列书籍的角色数据,记录了书中的主要及次要角色的详细信息。主要特征如下:... -
猎头公司雇主评价竞赛数据集-aleron751
猎头公司雇主评价竞赛数据集-aleron751 数据来源:互联网公开数据 标签:雇主评价,猎头,招聘,文本分析,情感分析,自然语言处理,机器学习,人力资源 数据概述: 该数据集包含来自Kaggle竞赛的猎头公司雇主评价数据,记录了用户对猎头公司的评价信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,具体取决于原始数据来源。... -
在线文章标题与标题党标签数据集OnlineArticleTitlewithClickbaitLabelDataset-bantalmetal
在线文章标题与标题党标签数据集OnlineArticleTitlewithClickbaitLabelDataset-bantalmetal 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,标题党,机器学习,内容推荐,传播学,信息处理 数据概述:... -
词语难度评估数据集DifficultiesofWordsDataset-natsumii
词语难度评估数据集DifficultiesofWordsDataset-natsumii 数据来源:互联网公开数据 标签:语言学习,词汇难度,数据集,教育技术,自然语言处理,语言学,文本分析,认知科学 数据概述: 该数据集包含来自语言学研究领域的词语难度评估数据,记录了不同词语的难度等级及相关特征。主要特征如下:... -
评论分析电商商品数据集ReviewAnalysisE-commerceProductDataset-dtughdr
评论分析电商商品数据集ReviewAnalysisE-commerceProductDataset-dtughdr 数据来源:互联网公开数据 标签:电商评论,数据集,自然语言处理,文本分析,机器学习,消费者行为,产品评价,数据分析 数据概述:该数据集包含来自电商平台的商品评论数据,记录了用户对产品的评价和反馈。主要特征如下:... -
辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore
辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore 数据来源:互联网公开数据 标签:剧本,文本分析,数据集,自然语言处理,机器学习,电视节目,对话分析,语言模型 数据概述:该数据集包含来自美国情景喜剧《辛普森一家》第一季的剧本文本数据,记录了节目的对话和剧情内容。主要特征如下:... -
职位技能匹配数据集JobandSkillsMatchingDataset-ashenranaweera
职位技能匹配数据集JobandSkillsMatchingDataset-ashenranaweera 数据来源:互联网公开数据 标签:职位,技能,数据集,自然语言处理,机器学习,文本分析,职业发展,人力资源 数据概述: 该数据集包含了职位描述和所需技能的信息,旨在用于职位与技能的匹配分析。主要特征如下:... -
网络犯罪新闻数据集CyberCrimeNewsDataSet-joel2706
网络犯罪新闻数据集CyberCrimeNewsDataSet-joel2706 数据来源:互联网公开数据 标签:网络犯罪,数据集,新闻分析,网络安全,数据挖掘,文本分析,社会学,法律 数据概述:该数据集包含来自多个新闻网站的网络犯罪相关报道,记录了近年来报道的各类网络犯罪事件。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2022年。... -
常见Lit阅读能力评估数据集CommonLitReadabilityAssessmentDataset-stripe
常见Lit阅读能力评估数据集CommonLitReadabilityAssessmentDataset-stripe 数据来源:互联网公开数据 标签:阅读能力,教育评估,数据集,文本分析,机器学习,自然语言处理,课程设计,教育技术 数据概述: 该数据集包含来自CommonLit阅读能力评估项目的数据,记录了不同文本的阅读难度评估信息。主要特征如下:... -
标注不良词汇数据集AnnotatedBadWordsDataset-devdhk
标注不良词汇数据集AnnotatedBadWordsDataset-devdhk 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,情感分析,内容审核,数据挖掘,人工智能 数据概述:该数据集包含经过人工标注的不良词汇数据,记录了各类网络文本中常见的不良词汇及其分类。主要特征如下:...