多明尼卡斯外交政策智库文本挖掘语料库

数据集概述

该数据集是一个用于文本挖掘的文档集合(语料库),核心内容围绕外交政策智库相关文本的分析展开,包含8个文件,以Excel表格和文本文档为主,为外交政策智库的文本分析研究提供基础数据支持。

文件详解

  • 数据文件(.xlsx格式,共7个)
  • parejas_domnicas.xlsx、CFR.xlsx、Valdiba2.xlsx、Wilson.xlsx、Brookings.xlsx、carnegie.xlsx、CSIS.xlsx:可能存储不同外交政策智库的结构化文本数据或相关信息
  • 文档文件(.txt格式,共1个)
  • stopwords_dictionary.txt:文本格式的停用词词典,预览包含Brookings、Carnegie、Wilson、cfr、csis等智库名称及相关词汇

适用场景

  • 外交政策研究:分析不同智库在外交政策议题上的文本特征与观点倾向
  • 文本挖掘应用:用于测试或训练针对智库文本的关键词提取、主题建模等NLP算法
  • 智库研究:对比不同外交政策智库的文本内容差异与研究重点
  • 停用词词典优化:基于智库领域词汇完善文本分析的停用词词典
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.07 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。