找到4个数据集

标签: 停用词表

过滤结果
  • Marian_Keyes_Based小说专有名词提取分析数据集2020

    2026年1月23日 30 175 126

    数据集概述 本数据集为爱尔兰研究委员会资助的博士论文相关研究成果,分析了Marian Keyes1995-2020年出版的14部小说中的专有名词,包含角色名称等内容。虽结果无统计显著性未纳入最终论文,但可为其他研究者提供角色名称停用词表,支持远读方法分析。 文件详解 文件名称:An analysis of proper nouns in Marian...
    packageimg
  • AAHD_III_Congreso_Based_考古学远程阅读与文本可视化研究数据集2018

    2026年1月12日 30 22 15

    数据集概述 本数据集为Daniela N. Ávido和Marcelo Vitores在2018年阿根廷罗萨里奥第三届数字人文协会国际会议上的报告配套数据,包含考古学期刊数据库、期刊内容索引表、论文链接表、Voyant-tools停用词表及论文语料库压缩包,共5个文件,用于考古学及相关学科的远程阅读与文本可视化研究。 文件详解 考古学期刊数据库文件...
    packageimg
  • Flemish_Archaeological_Texts_佛兰芒地区考古文献量化研究数据_2017

    2026年1月7日 30 103 14

    数据集概述 本数据集对1945-2017年比利时佛兰芒地区的荷兰语考古文献进行量化分析,涵盖专著、期刊文章、发掘报告等4500余份文献,共5100余万字。为避免版权问题,去除连词、冠词及4字母以下词汇,包含元数据、文本匹配结果、停用词表及处理后数据压缩包,支持研究复现。 文件详解 METADATA.xlsx 文件格式:XLSX...
    packageimg
  • 历史期刊_Francia_1973_2022年主题建模数据集

    2025年12月20日 30 188 42

    数据集概述 本数据集为《Francia》期刊1973-2022年主题建模研究的补充资料,包含数据报告、作者性别映射、多语言语料元数据、Mallet主题建模结果、文档-主题相关性及可视化文件,支撑该期刊研究趋势与内容的分析。 文件详解 数据报告文件:...
    packageimg