找到5个数据集

标签: LDA主题建模

过滤结果
  • LDA_Based印尼初中生Instagram标题主题建模数据集

    2026年1月28日 30 105 59

    数据集概述 本数据集围绕印尼初中生Instagram标题的LDA主题建模研究构建,包含原始爬取数据与建模代码文件,支持对青少年社交媒体文本内容的主题挖掘分析,共含2个文件。 文件详解 数据文件 文件名称:crawling.xlsx 文件格式:XLSX 字段映射介绍:原始爬取的印尼初中生Instagram标题数据,具体字段未提供预览 代码文件...
    packageimg
  • 福岛核污染水排放的国际话语框架_中日双方立场分析及LDA主题聚类完整数据集_2021_24年

    2026年1月12日 30 117 85

    数据集概述 本数据集记录2021-2024年中日两国关于福岛核污染水排放的话语内容,来源包括政府声明、官方媒体(如人民日报、朝日新闻、共同社)和社交媒体(如微博、5ch)。通过LDA主题建模和聚类分析,提取关键词、主题聚类、框架模式及频率统计,支持中日话语框架比较与风险沟通研究。 文件详解 文件名称:CN_official.xlsx 文件格式:XLSX...
    packageimg
  • 程序员幽默子版块提交内容研究复现数据包

    2025年12月21日 30 186 63

    数据集概述 本数据集是论文《What Makes Programmers Laugh? Exploring the Submissions of the Subreddit...
    packageimg
  • 中国新冠疫情新闻发布会文本框架分析数据集2020_2023

    2025年12月14日 30 86 76

    数据集概述 本数据集是基于2020-2023年中国新冠疫情新闻发布会文本,通过LDA主题建模方法进行框架分析的可视化结果集合,包含不同阶段的主题可视化文件,用于呈现疫情各阶段发布会文本的主题分布特征。 文件详解 文件名称:Overall_Open_Phase_LDA_Visualization (1).html 文件格式:HTML...
    packageimg
  • 量子软件编程问答平台实证研究数据集

    2025年12月5日 30 48 15

    数据集概述 该数据集汇集了Stack Exchange平台(含Stack Overflow、量子计算、代码审查、软件工程社区)的相关问题数据,用于开展量子软件编程领域的问答平台实证研究,为分析该领域的讨论主题、趋势及技术难点提供数据支持。 文件详解 问答数据文件: so.csv:Stack...
    packageimg