推特表情符号数据集-2021-mexwell

推特表情符号数据集-2021-mexwell 数据来源:互联网公开数据 标签:Twemoji,推特,表情符号,机器学习,数据集,图像识别,文本分析 数据概述: 本数据集包含1300万条推文,分为训练集、验证集和测试集,用于基于文本和/或图像预测表情符号的任务。数据集提供了每条推文的状态ID及其关联的表情符号注释。对于包含图像的子集,还列出了图像的URL。全数据集包含1000万条训练数据,100万条测试数据和100万条验证数据。为了改善表情符号类别的平衡,测试集中还有一组平衡的子集。图像子集包含带有图像的推文。emoji_map_1791.csv文件提供了关于表情符号标签及其潜在元数据的信息。用户可以通过状态ID在https://twitter.com/anyuser/status/后加上相应ID来获取推文内容。 数据用途概述: 该数据集适用于表情符号预测模型的训练和评估、自然语言处理、图像识别以及社交媒体数据分析等场景。研究人员可以利用此数据集开发和优化预测表情符号的算法;教育机构可以将其用于教学示例和实践项目;社交媒体平台可以利用这些数据改进用户体验和内容分析。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 182.79 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。