社交电商平台Instagram粉丝真伪分类数据集-armandkarimi
数据来源:互联网公开数据
标签:社交媒体,电商,粉丝分析,虚假账号,机器学习,分类,模型评估,Instagram,数据分析
数据概述:
本数据集模拟了在线电商初创企业在Instagram平台上的运营场景,该企业通过42个Instagram账号进行客户互动和销售。近期,这些账号的粉丝数量出现异常增长,但销售额并未同步增加,引发了对粉丝真实性的怀疑。为解决此问题,该企业的数据科学团队构建了一个机器学习分类器,用于区分真实粉丝和虚假粉丝。
数据集包含以下关键字段:
账号名称:Instagram账号的唯一标识符。
分类器得分:模型为每个粉丝判定为虚假账号的概率。
标签:真实标签,表示粉丝是真实(0)还是虚假(1)。标签由市场营销实习生人工标注,被认为是准确可信的。
数据用途概述:
该数据集适用于多种机器学习和数据分析任务,包括:
二元分类任务:训练和评估用于区分真实和虚假粉丝的分类模型。
模型性能评估:使用精确率、召回率、ROC曲线等指标评估分类器的性能。
阈值优化:探索和优化分类器的决策阈值,以平衡不同类型的错误。
分析分类器得分模式:研究分类器得分与粉丝真实性之间的关系,以及识别虚假账号的潜在特征。
此外,该数据集也适合用于实践机器学习技术、评估分类器性能、阈值优化和偏差缓解策略的实验。