微信短视频用户行为分析数据集WeChatShortVideoUserBehaviorAnalysis-pythonlan
数据来源:互联网公开数据
标签:用户行为分析, 短视频, 推荐系统, 社交媒体, 机器学习, 内容推荐, 数据挖掘, 行为预测
数据概述:
该数据集包含来自微信短视频平台的用户行为数据,记录了用户与短视频内容交互的详细信息。主要特征如下:
时间跨度:数据未标明具体时间,但根据数据字段推测为一段时间内的用户行为记录。
地理范围:数据来源于微信短视频平台,覆盖范围可能为平台用户群体。
数据维度:数据集包含多个CSV文件,涵盖了用户、视频、以及用户对视频的交互行为等多个维度。主要数据项包括:用户ID(userid)、视频ID(feedid)、设备类型(device)、用户行为发生日期(date_)、阅读评论(read_comment)、评论(comment)、点赞(like)、播放(play)、停留时长(stay)、点击头像(click_avatar)、转发(forward)、关注(follow)、收藏(favorite)、视频播放时长(videoplayseconds)、视频描述(description)、OCR文本(ocr)、ASR文本(asr)、背景音乐ID(bgm_song_id)、背景音乐演唱者ID(bgm_singer_id)、手动关键词列表(manual_keyword_list)、机器关键词列表(machine_keyword_list)、手动标签列表(manual_tag_list)、机器标签列表(machine_tag_list)、描述字符数(description_char)、OCR字符数(ocr_char)、ASR字符数(asr_char)以及视频的embedding向量(feed_embedding)。
数据格式:数据以CSV格式存储,包括test_a.csv、user_action.csv、feed_embeddings.csv、submit_demo_σê¥Φ╡¢a.csv、feed_info.csv等文件,便于数据分析和模型构建。
来源信息:数据来源于微信短视频平台,可能经过匿名化处理,用于算法竞赛或研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于用户行为分析、推荐系统、内容理解等领域的学术研究,如用户兴趣建模、视频内容相似度分析等。
行业应用:为短视频平台、社交媒体公司提供数据支持,尤其适用于用户行为预测、个性化内容推荐、用户画像构建等。
决策支持:支持平台的内容运营策略制定、用户增长策略优化以及广告投放效果评估等。
教育和培训:作为数据科学、机器学习等课程的实训素材,帮助学生和研究人员理解用户行为数据分析方法。
此数据集特别适合用于探索用户在短视频平台上的行为模式,构建推荐算法,提升内容推荐的精准度和用户粘性。