找到4个数据集

分类: 公开数据 标签: 推特ID

过滤结果
  • RepLab_Based实体导向摘要数据集_V1_0

    2026年1月31日 30 207 38

    数据集概述 本数据集基于RepLab 2013数据集构建,包含汽车和银行两个领域共31个实体的71,303条英西双语推特数据。数据按实体主题聚类,每个主题对应人工生成的英文抽象摘要、西班牙文抽象摘要和抽取式摘要,主题标注有优先级(Alert、Midly_important、unimportant),用于实体声誉管理相关研究。 文件详解 压缩包文件...
    packageimg
  • Islamophobic_Hate_Speech_Based社交媒体强弱仇恨言论检测数据2019

    2026年1月11日 30 76 20

    数据集概述 本数据集为2019年发表的“Detecting weak and strong Islamophobic hate speech on social media”研究配套数据,包含数据、代码及标注指南,共9个文件。涵盖社交媒体伊斯兰恐惧症仇恨言论的检测相关资源,可用于分析不同强度仇恨言论的特征与识别方法。 文件详解 文档文件...
    packageimg
  • TweetsCOV19_Geolocation_Part1_2019_2020_社交媒体地理数据

    2026年1月8日 30 134 33

    数据集概述 本数据集为TweetsCOV19地理定位数据集第一部分,涵盖2019年10月至2020年4月期间的推特地理信息。数据以制表符分隔格式存储,包含推特ID、经纬度、国家、州、县、城市等关键字段,共1个压缩文件,可用于分析特定时期推特内容的地理分布特征。 文件详解 文件名称:TweetsCOV19Part1geolocation.zip...
    packageimg
  • 时间感知命名实体识别推特语料库

    2025年12月10日 30 34 14

    数据集概述 该数据集为命名实体识别任务开发,包含2014-2019年的12000条标注推特,每年2000条。标注实体类型为地点(LOC)、人物(PER)和组织(ORG),用于研究时间数据漂移对NER模型的影响。 文件详解 文件名称: temporal-ner-twitter-corpus.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg