找到8个数据集

标签: 文本可视化

过滤结果
  • Topic_Modeling_Based_女性图书馆员相关文献主题分析数据集

    2026年1月20日 30 196 124

    数据集概述 本数据集围绕女性图书馆员相关文章的主题建模展开,包含用于NLP分析的代码文件、数据文件及文献检索查询文件,共4个文件,覆盖主题建模的核心过程与数据基础。 文件详解 代码文件 文件名称:Bertopic_Female_Lib.ipynb、scattertext.ipynb 文件格式:.ipynb...
    packageimg
  • Scarlet_Gown_Based_Robert_Murray诗歌编码数据_2022

    2026年1月14日 30 34 31

    数据集概述 本数据集是Robert Fuller Murray所著《The Scarlet Gown》第二版中诗歌《Adventure of a Poet》的有效XML-TEI编码数据,由帕多瓦大学数字文献学课程于2022年春季制作,包含1个XML文件。 文件详解 文件名称:Robert_Murray_P2P13_JG_2022_05_20.xml...
    packageimg
  • AAHD_III_Congreso_Based_考古学远程阅读与文本可视化研究数据集2018

    2026年1月12日 30 23 18

    数据集概述 本数据集为Daniela N. Ávido和Marcelo Vitores在2018年阿根廷罗萨里奥第三届数字人文协会国际会议上的报告配套数据,包含考古学期刊数据库、期刊内容索引表、论文链接表、Voyant-tools停用词表及论文语料库压缩包,共5个文件,用于考古学及相关学科的远程阅读与文本可视化研究。 文件详解 考古学期刊数据库文件...
    packageimg
  • AntConc聚类工具生成文件集合

    2025年12月22日 30 112 74

    数据集概述 本数据集为使用AntConc聚类工具生成的文件集合,包含文本、表格、图片及配置等多种格式文件,围绕不同主题词(如rights、german、ceremony等)的聚类结果展开,为文本聚类分析提供直接数据支持。 文件详解 文件总数:25个,均为根目录下的独立文件 文件类型分布:...
    packageimg
  • 视听图书馆作为新兴范式_从文献综述到信息服务数据集2024

    2025年12月20日 30 208 54

    数据集概述 本数据集围绕“视听图书馆作为新兴范式”主题,收录了2024年12月在BRAPCI数据库检索的53条相关文献(含7条重复记录),时间跨度1972-2024年。通过Evernote电子田野日记收集数据,结合Voyant Tools文本挖掘分析生成文本与视觉数据,最终通过Zenodo平台的视听信息社区开放共享。 文件详解...
    packageimg
  • 议会公民身份法案讨论Voyant分析结果数据集

    2025年12月20日 30 44 2

    数据集概述 本数据集是通过在线工具Voyant对加拿大众议院和参议院关于《公民身份法案》的议会讨论文本进行分析后生成的结果文件,包含词云、趋势图等多种可视化图表,反映讨论文本的核心词汇及趋势特征。 文件详解 该数据集包含6个PNG格式的可视化文件,具体说明如下: -...
    packageimg
  • 中国新冠疫情新闻发布会文本框架分析数据集2020_2023

    2025年12月14日 30 5 2

    数据集概述 本数据集是基于2020-2023年中国新冠疫情新闻发布会文本,通过LDA主题建模方法进行框架分析的可视化结果集合,包含不同阶段的主题可视化文件,用于呈现疫情各阶段发布会文本的主题分布特征。 文件详解 文件名称:Overall_Open_Phase_LDA_Visualization (1).html 文件格式:HTML...
    packageimg
  • Zipf变换与词频分析教学数据集_是_首相

    2025年12月9日 30 127 3

    数据集概述 本数据集是《应用科学计量学与信息科学II:知识表示》课程中Zipf变换与词频分析任务的配套教学材料,基于《Yes Prime Minister》(捷克译名《Jistě, pane premiére》)文本构建,包含数据文件与可视化图表。 文件详解 数据文件:...
    packageimg