数据集

社交平台评论毒性预测提交结果数据集SocialPlatformCommentToxicityPredictionSubmissionResults-ahmedengu

数据来源：互联网公开数据

标签：毒性检测, 社交媒体, 评论分析, 预测结果, 机器学习, 自然语言处理, 二元分类, 模型评估

数据概述：该数据集包含用户在社交平台上的评论毒性预测结果，记录了每个评论的唯一标识符（id）及其对应的毒性预测概率（prediction）。主要特征如下：时间跨度：数据未标明具体时间，为模型预测结果的静态快照。地理范围：数据来源于社交平台，未限定具体地理范围。数据维度：包括“id”（评论的唯一标识符）和“prediction”（模型预测的毒性概率）两个字段。数据格式：CSV格式，文件名为submission (28).csv，便于数据分析和模型评估。来源信息：数据来源于Jigsaw竞赛，用于评估模型在社交平台评论毒性检测任务上的表现。该数据集适用于模型评估、结果分析和进一步的毒性检测研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于社交媒体评论毒性分析、模型评估与对比研究，以及自然语言处理领域的模型优化研究。行业应用：为社交平台提供毒性检测模型评估依据，助力平台提升内容审核能力，减少有害信息的传播。决策支持：支持平台制定内容管理策略，优化用户体验，维护社区健康。教育和培训：作为机器学习、自然语言处理等相关课程的案例，帮助学生理解模型评估流程和毒性检测技术。此数据集特别适合用于分析不同模型的预测结果差异，评估模型的泛化能力，以及探索提升毒性检测准确性的方法。

数据与资源

versions_20250408082247.zipZIP
1.11 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.11 MiB
最后更新	2025年4月29日
创建于	2025年4月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

社交平台评论毒性预测提交结果数据集SocialPlatformCommentToxicityPredictionSubmissionResults-ahmedengu

数据与资源

附加信息

注册成功！