-
-
电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限
电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限 数据来源:互联网公开数据 标签:电影,TMDB,电影数据,NLP,自然语言处理,文本分析,情感分析,数据预处理,文本清洗,机器学习 数据概述: 本数据集包含了TMDB(The Movie... -
图书分类与评分预测数据集
图书分类与评分预测数据集 数据来源:互联网公开数据 标签:图书分类, 文本分析, 评分预测, 自然语言处理, 数据挖掘, 书籍推荐, 作者影响力, 清新阅读 数据概述:... -
权力的游戏Reddit社区讨论内容数据集
权力的游戏Reddit社区讨论内容数据集 数据来源:互联网公开数据 标签:权力的游戏,Reddit,社交媒体,讨论,评论,帖子,文本分析,情感分析 数据概述: 本数据集收录了从Reddit社交平台r/gameofthrones子版块抓取的全部帖子和评论数据。数据通过Reddit... -
-
社区电视节目台词数据集1963-2021
社区电视节目台词数据集1963-2021 数据来源:互联网公开数据 标签:社区电视节目,台词,语言模型,文本分析,电视剧研究,文化研究,历史背景 数据概述: 本数据集收录了某社区电视节目的全部台词记录,涵盖了从1963年至2021年间的多个季度和剧集。数据集通过网络爬虫技术收集,为研究该节目提供了全面的台词文本资料,适合进行语言模型训练和文本分析。... -
Reddit食谱分享与互动分析数据集
Reddit食谱分享与互动分析数据集 数据来源:互联网公开数据 标签:食谱,Reddit,社交媒体,文本分析,NLP,烹饪,菜谱,用户互动,数据挖掘 数据概述:... -
-
Commonlit阅读理解文章难度评估数据集-2020年8月
Commonlit阅读理解文章难度评估数据集-2020年8月 数据来源:互联网公开数据 标签:阅读理解,文本分析,教育,自然语言处理,阅读难度,文本数据,Commonlit,机器学习 数据概述:... -
Reddit读书建议社区书籍推荐数据集-时间跨度待定
Reddit读书建议社区书籍推荐数据集-时间跨度待定 数据来源:互联网公开数据 标签:书籍推荐, Reddit, 社交媒体, 文本分析, 自然语言处理, 情感分析, 图书评论, 读者互动 数据概述: 本数据集来源于Reddit社交平台上的r/booksuggestions子版块,该版块汇集了用户关于书籍的讨论与推荐。数据通过Python Reddit... -
NASA天文学图片每日一图数据集
NASA天文学图片每日一图数据集 数据来源:互联网公开数据 标签:NASA,天文学,图片,每日一图,教育,研究,图像处理,文本分析,关键词提取,实体识别 数据概述: 本数据集包含了NASA自1995年6月以来在其“Astronomy Picture of the... -
Reddit社区自杀风险帖子检测数据集
Reddit社区自杀风险帖子检测数据集 数据来源:互联网公开数据 标签:Reddit,自杀,心理健康,文本分析,情感分析,社交媒体,风险评估,自然语言处理 数据概述:... -
-
Reddit谎言推特谎言信息传播分析数据集-每周更新
Reddit谎言推特谎言信息传播分析数据集-每周更新 数据来源:互联网公开数据 标签:推特,社交媒体,谎言,Reddit,信息传播,时间序列,文本分析 数据概述:... -
美剧办公室演员解说播客节目文本数据集
美剧办公室演员解说播客节目文本数据集 数据来源:互联网公开数据 标签:播客,剧本,喜剧,办公室,文化,娱乐,音频,文本分析 数据概述: 本数据集包含美国知名情景喜剧《办公室》两位主演Jenna Fischer和Angela Kinsey主持的播客节目《Office... -
大英百科全书文章标题数据集
大英百科全书文章标题数据集 数据来源:互联网公开数据 标签:大英百科全书,文章标题,科技,艺术,文本分类,NLP,文本分析 数据概述: 本数据集收录了大英百科全书中的“艺术与科技”类目下的文章标题,通过大英百科全书API创建。未来版本将增加其他文章类别。数据集为进行文本分类、自然语言处理(NLP)任务和文本分析提供了丰富的标题样本。 数据用途概述:... -
推特文本情感分析-种族歧视与非歧视推文分类数据集
推特文本情感分析-种族歧视与非歧视推文分类数据集 数据来源:互联网公开数据 标签:推特,文本分析,情感分析,种族歧视,自然语言处理,社交媒体,文本分类,机器学习 数据概述: 本数据集包含推特推文数据,用于种族歧视与非种族歧视言论的分类研究。... -
全球高评分电影字幕数据-电影列表字幕文件
全球高评分电影字幕数据-电影列表字幕文件 数据来源:互联网公开数据 标签:电影,评分,字幕,影视,娱乐,文化,语言,文本分析,数据挖掘 数据概述:... -
泽伦斯基推特数据集2019年至今
泽伦斯基推特数据集2019年至今 数据来源:互联网公开数据 标签:泽伦斯基,推特,文本分析,乌克兰政治,言论分析,社交媒体 数据概述: 本数据集包含了2019年至今乌克兰总统泽连斯基在推特平台上发布的所有推文。数据按发布日期降序排列,涵盖了总统的言论内容,为分析其言论风格、政治立场及公众沟通方式提供了丰富的文本材料。 数据用途概述:... -