社交电商平台Instagram粉丝真伪分类数据集-armandkarimi

社交电商平台Instagram粉丝真伪分类数据集-armandkarimi

数据来源:互联网公开数据

标签:社交媒体,电商,粉丝分析,虚假账号,机器学习,分类,模型评估,Instagram,数据分析

数据概述: 本数据集模拟了在线电商初创企业在Instagram平台上的运营场景,该企业通过42个Instagram账号进行客户互动和销售。近期,这些账号的粉丝数量出现异常增长,但销售额并未同步增加,引发了对粉丝真实性的怀疑。为解决此问题,该企业的数据科学团队构建了一个机器学习分类器,用于区分真实粉丝和虚假粉丝。

数据集包含以下关键字段:

账号名称:Instagram账号的唯一标识符。 分类器得分:模型为每个粉丝判定为虚假账号的概率。 标签:真实标签,表示粉丝是真实(0)还是虚假(1)。标签由市场营销实习生人工标注,被认为是准确可信的。

数据用途概述: 该数据集适用于多种机器学习和数据分析任务,包括:

二元分类任务:训练和评估用于区分真实和虚假粉丝的分类模型。 模型性能评估:使用精确率、召回率、ROC曲线等指标评估分类器的性能。 阈值优化:探索和优化分类器的决策阈值,以平衡不同类型的错误。 分析分类器得分模式:研究分类器得分与粉丝真实性之间的关系,以及识别虚假账号的潜在特征。 此外,该数据集也适合用于实践机器学习技术、评估分类器性能、阈值优化和偏差缓解策略的实验。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.05 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。