日本酒店推荐用户行为预测数据集

日本酒店推荐用户行为预测数据集_Japan_Hotel_Recommendation_User_Behavior_Prediction

数据来源:互联网公开数据

标签:酒店推荐, 用户行为分析, 序列预测, 机器学习, 旅游, 住宿, 会话, 深度学习

数据概述: 该数据集包含来自日本酒店预订平台的用户行为数据,旨在用于预测用户在浏览酒店时的选择偏好。主要特征如下: 时间跨度:数据未明确标明具体时间范围,但可推断为用户在浏览酒店时的行为记录。 地理范围:数据主要集中在日本地区的酒店信息,包括酒店位置、设施等。 数据维度: train_log.csv: 训练集的用户会话记录,包含session_id(用户会话ID)、seq_no(会话内的浏览顺序)、yad_no(酒店ID)。 test_log.csv: 测试集的用户会话记录,结构与train_log.csv相同。 train_label.csv: 训练集的标签数据,包含session_id(用户会话ID)和yad_no(用户最终选择的酒店ID)。 yado.csv: 酒店信息,包含yad_no(酒店ID)、yad_type(酒店类型)、total_room_cnt(总房间数)、wireless_lan_flg(是否有无线网络)、onsen_flg(是否有温泉)、kd_stn_5min, kd_bch_5min, kd_slp_5min, kd_conv_walk_5min(酒店周边设施的步行距离)、wid_cd, ken_cd, lrg_cd, sml_cd(酒店的地理位置编码)。 test_session.csv: 测试集的用户会话ID。 sample_submission.csv: 提交示例文件,包含预测的酒店ID(predict_0到predict_9)。 image_embeddings.parquet: 酒店图片的嵌入向量(未提供)。 数据格式:数据以CSV和Parquet格式提供,便于数据分析和模型训练。 来源信息:数据来源于公开的竞赛或研究项目,已进行匿名化处理,保证用户隐私。 该数据集适合用于用户行为分析、序列预测和酒店推荐系统的研究与开发。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于用户行为分析、推荐系统、序列建模等方向的学术研究,如用户浏览行为预测、个性化酒店推荐算法开发等。 行业应用:为在线旅游平台、酒店预订网站提供数据支持,用于提升用户体验、优化推荐效果、提高转化率。 决策支持:支持酒店行业的市场分析和营销策略制定,例如了解用户偏好、优化酒店设施和服务。 教育和培训:作为机器学习、数据挖掘、推荐系统等课程的实训材料,帮助学生和研究人员掌握相关技术。 此数据集特别适合用于探索用户在酒店选择过程中的行为模式,预测用户最终选择的酒店,从而实现个性化推荐和精准营销,提升用户满意度。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1222.57 MiB
最后更新 2025年7月30日
创建于 2025年7月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。