-
Yelp商家评价星级预测文本数据集
Yelp商家评价星级预测文本数据集 数据来源:互联网公开数据 标签:Yelp,商家评价,星级预测,文本分析,自然语言处理,用户评论,情感分析,机器学习 数据概述:... -
移动应用无障碍用户评论情感分析数据集
移动应用无障碍用户评论情感分析数据集 数据来源:互联网公开数据 标签:无障碍,用户评论,情感分析,移动应用,机器学习,文本分析,自然语言处理,软件工程,ASEW 数据概述:... -
中国官方每日新闻报道数据集2016-2023
中国官方每日新闻报道数据集2016-2023 数据来源:互联网公开数据 标签:中国官方新闻,每日新闻,新闻报道,文本分析,主题提取,意见挖掘,新闻研究 数据概述:... -
LLM生成文本检测竞赛数据集
LLM生成文本检测竞赛数据集 数据来源:互联网公开数据 标签:LLM生成文本,人工智能检测,竞赛数据,自然语言处理,文本分析 该数据集专为 “LLM - Detect AI Generated Text” Kaggle 竞赛而构建,内容由大型语言模型(LLMs)生成的英文文章组成。数据基于公开可用的外部语料改写生成,但其原始数据并未包含在 DAIGT... -
电影评论情感分析数据集-Top100电影-评论数据
电影评论情感分析数据集-Top100电影-评论数据 数据来源:互联网公开数据 标签:情感分析, 电影评论, 自然语言处理, NLP, 影评, 文本分析, 情感极性, 机器学习, 电影, 评论 数据概述: 本数据集旨在分析大规模文本输入的情感倾向,主要聚焦于对Top... -
arXiv论文标题-摘要与主题分类数据集-适用于自然语言处理项目
arXiv论文标题-摘要与主题分类数据集-适用于自然语言处理项目 数据来源:互联网公开数据 标签:arXiv,论文,标题,摘要,主题分类,自然语言处理,NLP,文本分析,主题建模 数据概述:... -
哥伦比亚观察家报推文文本数据集-2019至今
哥伦比亚观察家报推文文本数据集-2019至今 数据来源:互联网公开数据 标签:推文,社交媒体,新闻,文本分析,自然语言处理,西班牙语,哥伦比亚,舆情分析 数据概述: 本数据集收录了2019年至今哥伦比亚报纸《观察家报》(El Espectador)的推文文本数据。该数据集源于微软 Power Automate 和 Power BI... -
Reddit平台边缘型人格障碍讨论帖文数据集
Reddit平台边缘型人格障碍讨论帖文数据集 数据来源:互联网公开数据 标签:边缘型人格障碍,BPD,Reddit,社交媒体,心理健康,情感障碍,用户体验,文本分析,情绪分析 数据概述: 本数据集包含5,879篇来自Reddit平台的帖子,这些帖子讨论了边缘型人格障碍(BPD, Borderline Personality... -
在线评论欺骗检测数据集2023
在线评论欺骗检测数据集2023 数据来源:互联网公开数据 标签:在线评论,欺骗检测,文本分析,自然语言处理,机器学习,数据挖掘 数据概述: 本数据集来源于Kaggle,包含了用于欺骗性意见垃圾邮件检测的评论文本记录。数据集包括真实的和欺骗性的在线评论,每个评论都经过标注,可以帮助研究人员和开发者训练和评估文本分析及自然语言处理模型。 数据用途概述:... -
-
社交媒体数据样本
社交媒体数据样本 数据来源:互联网公开数据 标签:社交媒体,Instagram,Facebook,TikTok,YouTube,数据清理,文本分析,用户行为,内容分析 数据概述:... -
WhatsApp谣言传播分析数据集-boatos-org网站谣言文本-时间跨度未知
WhatsApp谣言传播分析数据集-boatos-org网站谣言文本-时间跨度未知 数据来源:互联网公开数据 标签:谣言,WhatsApp,社交媒体,文本分析,自然语言处理,假新闻,舆情分析,巴西,boatos.org,传播规律 数据概述:... -
钦定本圣经旧约与新约章节数据集
钦定本圣经旧约与新约章节数据集 数据来源:互联网公开数据 标签:钦定本圣经,旧约,新约,章节,经文,宗教研究,文本分析,历史文献 数据概述: 本数据集收录了钦定本圣经(King James... -
有声书平台用户评价数据清洗与分析数据集
有声书平台用户评价数据清洗与分析数据集 数据来源:互联网公开数据 标签:有声书,用户评价,数据清洗,SQL,MySQL,用户行为,文本分析,情感分析 数据概述:... -
-
毒性数据集
毒性数据集 数据来源:互联网公开数据 标签:毒性,文本分析,自然语言处理,机器学习,内容审核,社交媒体,网络言论 数据概述: 本数据集收录了多种来源的文本数据,涵盖社交媒体评论、论坛帖子、新闻评论等,主要用于识别和分析其中的毒性内容。数据集标注了不同类型的毒性评论,如侮辱、威胁、歧视等,为研究文本中的不良内容提供了丰富的样本。 数据用途概述:... -
巴西葡萄牙语讽刺与讽刺数据集
巴西葡萄牙语讽刺与讽刺数据集 数据来源:互联网公开数据 标签:讽刺,讽刺检测,巴西葡萄牙语,自然语言处理,文本分析,情感分析,社交媒体分析 数据概述: 本数据集是从2021年3月20日Fabio Ricardo Araujo da Silva和Andreia Gentil Bonfante在https://github.com/fabio-... -
说唱歌词NLP数据集
说唱歌词NLP数据集 数据来源:互联网公开数据 标签:说唱,歌词,NLP,文本分析,文本预处理,文本分类,音乐分析 数据概述: 本数据集收录了来自11位不同艺术家的说唱歌词,包括Drake、J. Cole、Kendrick Lamar、Eminem、Nas、Skepta、Rapsody、Nicki... -
土耳其恶意内容推文数据集2023
土耳其恶意内容推文数据集2023 数据来源:互联网公开数据 标签:土耳其,推文,社交媒体,恶意内容,文本分析,语言处理,社会研究 数据概述: 本数据集收录了来自Twitter的土耳其推文,涵盖2023年的推文内容。数据集中约40%的推文包含冒犯性或粗俗的语境,为研究社交媒体上的恶意内容提供了宝贵的材料。每个推文记录了原文、发布时间、推文语言等关键信息。... -
电影类型预测竞赛数据集1963-2021
电影类型预测竞赛数据集1963-2021 数据来源:互联网公开数据 标签:电影类型,预测模型,人工智能竞赛,数据可视化,机器学习,文本分析 数据概述:...