蔡徐坤B站视频评论弹幕数据集-2022年11月
数据来源:互联网公开数据
标签:蔡徐坤,B站,视频,评论,弹幕,数据分析,社交媒体,公众人物
数据概述:
本数据集通过Bilibili API采集了截至2022年11月25日搜索关键词“蔡徐坤”排名前900+的视频数据,包含评论和弹幕等信息。数据集分为四个文件夹:kun_comments、kun_complete、kun_danmakus、kun_utils。
- kun_comments 文件夹包含每个视频的评论信息,文件格式为 {aid}.csv。
- kun_danmakus 文件夹包含每个视频的弹幕信息,文件格式为 {oid}.csv。
- kun_utils 文件夹包含以下文件:
- aid.csv:视频标题及其对应的aid(视频唯一标识符)
- bvid.csv:视频标题及其对应的bvid(视频唯一标识符)
- oid.csv:视频标题及其对应的oid(视频对象标识符)
- kun_search.csv:排名前999个视频的搜索结果
- kun_complete 文件夹包含所有评论和弹幕数据:
- kun_comment_parquet:所有评论数据的parquet格式文件
- top__kun_comment_parquet:排名前个视频的评论数据的parquet格式文件
- kun_comment.csv:所有评论数据的csv格式文件
- top_kun_comment.csv:排名前个视频的评论数据的csv格式文件
数据用途概述:
该数据集适用于社交媒体分析、公众人物研究、用户行为研究、自然语言处理等多种场景。研究者和分析人员可以利用此数据集进行公众人物的社会反响分析、用户互动模式研究、文本情感分析等。此外,数据集也适合用于教育培训,帮助学习者理解社交媒体数据的采集与分析方法。