印度StayZilla平台房产共享市场数据集2005至2017-PromptCloudHQ
数据来源:互联网公开数据
标签:StayZilla,房产共享,印度,市场分析,地理分布,文本描述,旅游
数据概述:
本数据集是通过对StayZilla.com(一家2005年至2017年间运营的印度AirBnB-like初创企业)的网页爬虫抓取所得,包含超过61,000个房产记录的子集。数据集涵盖了一系列关键字段,如房产信息、设施、位置、价格、描述等内容,为研究印度房产共享市场的特征提供了详实的数据支持。
数据包含了以下字段:
additional_info - 关于该房产的特殊注意事项。
amenities - 以管道(|)分隔的房产提供的设施列表。
check_in_date - 入住日期。
check_out_date - 离店日期。
city - 城市。
country - 国家。
crawl_date - 爬虫抓取日期。
description - 列表者在网站上输入的房产文本描述。
highlight_value - 列表者在网站上输入的房产亮点。
hotel_star_rating - 如果该房产是酒店,则为5星级评分(并非所有酒店都有评分)。
image_count - 列表者上传的图片数量。
image_urls - 图片链接。
internet - 该房产是否有互联网接入(是/否)。
landmark - 地标。
latitude - 纬度。
longitude - 经度。
occupancy - 可预订的成人和儿童数量。
pageurl - 房产页面链接。
property_address - 房产地址。
property_id - 房产ID。
property_name - 房产名称。
property_type - 房产类型(住宅、酒店、度假村等)。
qts - 爬虫时间戳。
query_time_stamp - qts的副本。
room_price - 房间价格。
room_types - 房间内的床和浴室数量。
search_term - 搜索项。
service_value - 是否由StayZilla验证的房产(包含一些垃圾条目)。
similar_hotel - 一些相似的房产名称。
sitename - 网站名称。
things_to_do - 列表者输入的附近活动。
things_to_note - 列表者输入的特殊注意事项。
数据用途概述:
该数据集适用于多种研究与分析场景,包括印度房产共享市场的特征分析、市场与全球其他地区(如美国)的对比研究、房产描述内容分析、房产地理分布研究等。研究人员可利用此数据了解印度房产共享市场的独特性及其与美国等市场的差异;教育者可以利用这些数据进行市场分析课程的教学;政策制定者可参考数据制定相关政策,促进房产共享市场的健康发展。此外,旅游研究者可以利用该数据了解印度各地的住宿情况及其周边活动,为旅游规划提供参考。