数据集概述
本数据集包含约2000个Google Shopping(美国版)的HTML页面,是2016年7月由不同地区的合成用户搜索不同产品获得的结果。页面按地理位置、用户ID和搜索产品命名,覆盖菲律宾、美国、印度三个地区,涉及130个产品关键词,用于研究关键词分面搜索的透明度问题。
文件详解
- 文件名称:
g_shopping_html_pages.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含约2000个HTML文件,每个文件名称格式为
no_email_LOCATION_USERID.PRODUCT.shopping_testing.#.html,其中LOCATION代表搜索地区(PHI/US/IN),USERID为用户编号,PRODUCT为搜索产品关键词;文件内容为Google Shopping搜索结果页面,包含产品列表、价格(美元,不含运费)等信息。
数据来源
论文“Transparency in Keyword Faceted Search: An Investigation on Google Shopping”
适用场景
- 电商搜索透明度研究:分析不同地区用户在Google Shopping中搜索结果的差异,验证价格引导现象。
- 用户地理位置与搜索结果相关性分析:探究地理位置对电商平台搜索结果展示的影响机制。
- 合成用户行为模拟研究:基于合成用户的搜索行为数据,优化电商搜索模拟实验设计。
- 电商平台算法公平性评估:为评估Google Shopping搜索算法的公平性提供实证数据支持。