MyAnimeList动漫评论情感分析数据集MALCoD-2006-2019
数据来源:互联网公开数据
标签:动漫评论,MyAnimeList,情感分析,自然语言处理,动漫趋势,动漫流派,用户评论
数据概述:
本数据集包含了MyAnimeList.net网站自2006年以来超过13万条的动漫评论。这些评论是通过开源爬虫程序MyAnimeList-Comment-Crawler收集的。每条评论都附带了从0到10的评分。该数据集专注于评论内容,与azathoth42/myanimelist和CooperUnion/anime-recommendations-database等数据集有所不同,后者更侧重于动漫推荐。
数据集包含以下文件:
animeReviewsOrderByTime.csv:包含了截止到2019年上半年的评论数据,包括评论ID、动漫作品ID、动漫作品名称、发布时间、评论时观看的集数、用户、评论有用人数、各种评分和评论内容。
animeListGenres.csv:列出了超过1万部独特的动漫作品,包括动漫作品ID、英文名称、日语名称的同义词、日语名称、集数和流派。
animeList.csv:包含了动漫作品ID及其对应的流派。
reviewsByWork.json:提供了年度摘要,包括从另一个项目GURA-gru-unit-for-recognizing-affect训练的情感分类预测值。
数据用途概述:
该数据集适用于情感分析、自然语言处理,或用于分析动漫趋势和流派受欢迎程度。用户可以利用该数据进行情感分析模型的训练,研究动漫作品的评论情感分布,分析动漫作品的受欢迎程度与用户评论之间的关系,以及研究不同流派动漫作品的评论特征。