孟加拉语虚假评论检测数据集BFRD-食品评论-2024-shawontanvir

孟加拉语虚假评论检测数据集BFRD-食品评论-2024-shawontanvir 数据来源:互联网公开数据 标签:虚假评论检测,孟加拉语,情感分析,自然语言处理,机器学习,文本分类,社交媒体,评论数据

数据概述: 本数据集“孟加拉语虚假评论检测数据集”(BFRD)是一个二元分类数据集,旨在用于孟加拉语虚假评论的检测研究。该数据集包含来自社交媒体平台的食品相关评论,由四位母语为孟加拉语的专家进行标注,标注的可信度超过90%。数据集的Fleiss' Kappa评分为0.83,表明标注者之间的一致性较高。

数据集包含以下统计信息: * 虚假评论数量:1339条 * 非虚假评论数量:7710条

数据集的其他统计特征:

| 统计指标 | 虚假评论 | 非虚假评论 | | | | - | | 总词数 | 155,789 | 927,902 | | 唯一词数 | 17,739 | 51,200 | | 最大评论长度 | 693 | 1,614 | | 平均每条评论词数 | 116.35 | 120.35 | | 平均每条评论唯一词数 | 84.99 | 88.42 |

数据用途概述: 该数据集主要用于孟加拉语虚假评论的检测研究,适用于训练和评估机器学习模型,尤其是自然语言处理(NLP)模型。研究人员可以使用该数据集进行情感分析、文本分类、虚假信息检测等方面的研究。该数据集可以用于开发和测试检测孟加拉语虚假评论的系统,有助于提高在线评论的可靠性,保护消费者和商家的权益。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 3.27 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。