Google_Shopping_Based关键词分面搜索透明度研究_HTML页面数据2016

数据集概述

本数据集包含约2000个Google Shopping(美国版)的HTML页面,是2016年7月由不同地区的合成用户搜索不同产品获得的结果。页面按地理位置、用户ID和搜索产品命名,覆盖菲律宾、美国、印度三个地区,涉及130个产品关键词,用于研究关键词分面搜索的透明度问题。

文件详解

  • 文件名称:g_shopping_html_pages.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含约2000个HTML文件,每个文件名称格式为no_email_LOCATION_USERID.PRODUCT.shopping_testing.#.html,其中LOCATION代表搜索地区(PHI/US/IN),USERID为用户编号,PRODUCT为搜索产品关键词;文件内容为Google Shopping搜索结果页面,包含产品列表、价格(美元,不含运费)等信息。

数据来源

论文“Transparency in Keyword Faceted Search: An Investigation on Google Shopping”

适用场景

  • 电商搜索透明度研究:分析不同地区用户在Google Shopping中搜索结果的差异,验证价格引导现象。
  • 用户地理位置与搜索结果相关性分析:探究地理位置对电商平台搜索结果展示的影响机制。
  • 合成用户行为模拟研究:基于合成用户的搜索行为数据,优化电商搜索模拟实验设计。
  • 电商平台算法公平性评估:为评估Google Shopping搜索算法的公平性提供实证数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1019.51 MiB
最后更新 2026年1月17日
创建于 2026年1月17日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。