数据集

推特用户垃圾账号识别特征数据集

推特用户垃圾账号识别特征数据集数据来源：互联网公开数据标签：推特,社交媒体,垃圾账号,用户行为,机器学习,数据分析,账号识别,特征工程数据概述：本数据集包含一组用于识别推特平台上的垃圾账号的特征数据。这些特征从多个维度描述了推特用户的行为和账号信息，旨在帮助构建机器学习模型，以区分真实用户和垃圾账号。数据集包含了多个关键特征，涵盖了用户关注、粉丝数量、推文数量、账号创建时长等多个方面。具体特征包括：

NumberOfFollowings（关注人数）：用户关注的账号数量。 NumberOfFollowers（粉丝数量）：用户的粉丝数量。 NumberOfTweets（推文数量）：用户发送的推文总数。 LengthOfScreenName（用户名长度）：用户个人资料用户名（ScreenName）的字符长度。 LengthOfDescriptionInUserProfile（个人简介长度）：用户个人资料描述信息的字符长度。 AccountAge（账号年龄）：从账号创建到最近一次发推的时间间隔（天）。 FollowersToFollowingsRatio（关注/粉丝比）：粉丝数量与关注人数的比例。 numWords（平均每条推文的单词数）：用户每条推文的平均单词数。 numMentions（平均每条推文的提及数）：用户每条推文的平均提及其他用户的次数。 numHashtags（平均每条推文的标签数）：用户每条推文的平均使用标签的数量。 numLinks（平均每条推文的链接数）：用户每条推文的平均链接数量。 AvgTweetsperDay（平均每日推文数）：用户平均每天发送的推文数量。

数据用途概述：该数据集主要用于垃圾账号检测、用户行为分析和社交媒体研究。研究人员和数据科学家可以使用此数据来训练和评估机器学习模型，以识别和过滤垃圾账号。此外，该数据集也可用于分析垃圾账号的行为特征，揭示垃圾信息传播的规律，并为社交媒体平台的安全策略提供参考。同时，该数据集也适用于教育和研究目的，例如作为机器学习实践的案例，或者用于探索用户行为模式的研究。

数据与资源

推特用户垃圾账号识别特征数据集.zipZIP
6.55 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	6.55 MiB
最后更新	2025年4月14日
创建于	2025年4月14日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

推特用户垃圾账号识别特征数据集

数据与资源

附加信息

注册成功！