Topic_Modeling_Based_女性图书馆员相关文献主题分析数据集

关注者: 0

资源积分: 30

分类

公开数据

公开数据

授权

没有提供授权

数据集

Topic_Modeling_Based_女性图书馆员相关文献主题分析数据集

数据集概述

本数据集围绕女性图书馆员相关文章的主题建模展开，包含用于NLP分析的代码文件、数据文件及文献检索查询文件，共4个文件，覆盖主题建模的核心过程与数据基础。

文件详解

代码文件
文件名称：Bertopic_Female_Lib.ipynb、scattertext.ipynb
文件格式：.ipynb
字段映射介绍：包含主题建模（如BERTopic）和文本可视化（如Scattertext）的代码实现，用于处理女性图书馆员相关文章的文本数据并生成主题模型
数据文件
文件名称：female_clean.json
文件格式：.json
字段映射介绍：存储清洗后的女性图书馆员相关文章文本数据，核心字段为nlp_text（文本内容）
检索查询文件
文件名称：search-query.txt
文件格式：.txt
字段映射介绍：包含文献检索的关键词组合，如"female PRE/2 librarian*"等，用于获取女性图书馆员相关的研究文献

适用场景

文献主题趋势分析: 利用主题建模结果，分析女性图书馆员领域研究主题的分布与演变
文本可视化研究: 通过scattertext文件实现女性图书馆员相关文本的交互式可视化，辅助主题理解
文献检索策略优化: 基于search-query.txt的检索逻辑，优化图书馆学领域特定主题的文献检索效率
自然语言处理应用: 作为NLP主题建模任务的案例数据，用于BERTopic等模型的实践与验证

数据与资源

10086962.zipZIP
2.89 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	2.89 MiB
最后更新	2026年1月20日
创建于	2026年1月20日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？