动漫角色偏好与推荐数据集-Anime-Planet平台用户数据-2023年
数据来源:互联网公开数据
标签:动漫,角色,偏好,推荐,用户行为,情感分析,社交媒体,动漫社区
数据概述:
本数据集收录了Anime-Planet动漫社区平台的用户角色偏好数据,涵盖了132,028个动漫角色和72,629位用户的互动信息。数据集包含角色信息、用户角色偏好列表以及角色HTML页面。其中,角色信息包括角色标签、描述、性别等;用户角色偏好列表记录了用户对角色的喜爱程度(喜欢或讨厌);角色HTML页面提供了更详尽的角色信息,可用于数据抓取。
数据集包含以下主要文件:
user_characters.csv
:记录了用户对角色的偏好,包含约1200万行数据。字段包括:
user_id
:匿名用户ID。
character_id
:匿名角色ID。
loved
:布尔值,表示用户是否喜欢该角色(True为喜欢,False为讨厌)。
characters_metadata.csv
:包含了每个角色的元数据信息,共132,028条记录。字段包括:
ID
:匿名角色ID。
Name
:角色全名。
Alias
:角色别名。
Gender
:角色性别。
Hair Color
:角色发色。
Love Rank
:基于用户偏好的喜爱度排名。
Hate Rank
:基于用户偏好的讨厌度排名。
Eye color
:角色眼睛颜色。
Birthday
:角色生日。
Blood Type
:角色血型。
Tags
:角色标签,以逗号分隔。
Love Count
:喜欢该角色的用户数量。
Hate Count
:讨厌该角色的用户数量。
Description
:角色简短描述。
url
:Anime-Planet上该角色的主页URL。
html
文件夹:包含每个角色的HTML页面,共132,028个文件。提供更详细的角色信息,可用于进一步的数据抓取。为减小数据集大小,仅提供了2个示例文件,所有HTML文件可在以下链接获取:https://drive.google.com/drive/folders/1Kg0OZ6dEsQuJZVqj1CcTGwDnwp4sNOnW?usp=sharing
请注意:本数据集包含成人动漫角色的信息。
数据用途概述:
该数据集可用于多种研究和应用场景,包括:角色推荐系统开发、用户偏好分析、动漫角色情感分析、基于内容的推荐、协同过滤推荐、动漫社区用户行为分析等。研究人员可以利用此数据构建角色推荐模型,分析用户对不同角色的偏好,探索动漫角色之间的关系,以及研究动漫社区用户的行为模式。此外,该数据集也适用于教育和培训,例如用于机器学习、数据挖掘等课程的实践项目。