找到2个数据集

格式: zip 标签: NLP

过滤结果
  • 特朗普政治言论分析用推特数据集

    2025年5月25日 30 18 1

    数据简介: 该数据集收集了与唐纳德·特朗普(Donald Trump)相关的推文文本及其元信息,内容涵盖用户生成的转发、评论和直接提及。数据时间上集中于2015年前后美国大选时期,具有一定的舆情代表性,可用于情感分析、文本分类、信息传播研究、政治观点分析等多种任务。 数据源自 Twitter...
    packageimg
  • 用于 NLP 任务的高质量金融新闻数据集

    2025年2月13日 367 22 5

    此存储库包含从各个金融网站精心抓取的数据集。数据提取过程可确保文本高质量且准确,包括网站及其嵌入 PDF 的内容。 数据集特征 日期: 公告日期。 主题:财经新闻的主题。 内容:公告的全部内容,包括网站文本和 PDF。 附加处理字段 我们应用先进的 Mixtral 7X8 模型来生成以下附加字段:...
    packageimg