Cyclistic共享单车骑行数据清洗数据集-2020年1月至2021年9月
数据来源:互联网公开数据
标签:共享单车,骑行数据,数据清洗,芝加哥,Cyclistic,时间序列,交通出行,数据分析
数据概述:
本数据集是经过预处理的Cyclistic共享单车骑行数据,用于数据分析。原始数据经过以下清洗:
1. 移除重复的骑行ID(重复骑行记录的开始/结束时间不一致)。
2. 删除包含空值的所有行(站点名称、ID和坐标存在空值)。
3. 修正站点名称中的拼写错误和不一致之处。
4. 删除不一致的站点ID并创建新的ID。
5. 移除用于仓储和维护的骑行记录。
6. 删除开始和结束日期不合理的骑行记录(部分骑行结束时间早于开始时间)。
数据集包含:
1. 2020年1月至2021年9月的完整清洗数据集,共13个月数据。
2. 2020年10月至2021年9月的完整清洗数据集,共12个月数据。
3. 2020年10月至2021年9月的清洗数据集(仅包含开始/结束站点ID,不包含站点信息),共7个月数据。
4. 包含每个站点信息的2个数据集。
数据由Motivate International Inc.授权。
数据用途概述:
该数据集适用于骑行行为分析、用户画像研究、骑行模式识别、市场营销策略制定等多种场景。研究人员可用于分析骑行时长、路线、用户类型等因素对骑行需求的影响;市场人员可用于制定针对性的营销活动;城市规划者可用于优化共享单车站点布局。