-
Semantic_Search_Based_语义搜索文献综述与研究议程数据
2026年1月21日 30 172 73
数据集概述 本数据集为提交至IEEE Access的语义搜索文献综述与研究议程相关数据,包含二十四个文件,涵盖文献引用数据、LDA模型文件、文献库数据等内容,涉及ScienceDirect、Web of Science、IEEE等来源的文献信息及语义分析模型相关文件,为语义搜索领域的研究提供文献支撑与分析基础。 文件详解 文献引用数据文件...
-
Stack_Overflow_Based_软件设计讨论半监督主题建模研究数据
2026年1月20日 30 182 13
数据集概述 本数据集是关于软件设计讨论的半监督主题建模研究数据,基于Stack Overflow平台的设计相关问答内容,探索结合专家输入与半监督方法(Anchored CorEx)识别设计主题的有效性,可用于分析软件开发中的设计知识呈现与讨论特征。 文件详解 文件名称:replication-package.zip 文件格式:ZIP...
-
Humanities_Retracted_Based_人文领域撤稿文章定量定性引用分析数据集
2026年1月17日 30 129 115
数据集概述 本数据集包含人文领域撤稿文章的引用分析数据,包括引用实体特征、引用上下文及摘要、排除的低相关性撤稿文章列表,以及基于摘要和引用上下文的主题建模结果,支持对人文领域撤稿文章引用模式的定量与定性研究。 文件详解 压缩包文件: 文件名称:data.zip 文件格式:ZIP 内容说明:包含所有数据集文件和目录的压缩包,需解压后访问内部内容...
-
科学教育研究主题建模数据集
2025年12月10日 30 17 4
数据集概述 本数据集包含Wiley期刊《Science Education》(前身为《General Science Quarterly》)近百年发表文章的文本数据,经清洗处理后用于自然语言处理分析,特别是潜在狄利克雷分配(LDA)主题建模。数据集包含5577篇1922年后发表的文章文本及相关元数据,并提供Jupyter...
-
撤回文章定性定量引用分析方法论数据集
2025年12月8日 30 202 7
数据集概述 本数据集是《撤回文章的定性定量引用分析:案例研究》方法论应用的成果,包含数据收集阶段的引用实体特征与文本数据集,以及基于引用摘要和上下文的主题建模结果,为撤回文章引用行为研究提供支持。 文件详解 数据集包含一个压缩文件及解压后的子文件,具体说明如下: - 主压缩文件: - method_data.zip:...
-
儿童言语障碍文献主题建模数据集_LDA与BERTopic
2025年12月6日 30 123 9
数据集概述 本数据集及代码用于通过LDA和BERTopic方法分析儿童言语障碍研究论文的主题,数据来源于PubMed并经处理以支持主题建模,为儿童言语障碍领域的文献主题研究提供数据与方法支持。 文件详解 文件名称: speech_disorders_topic_modeling.zip 文件格式: ZIP压缩包(.zip) 文件内容:...
-
天文学与艺术主题文档主题分析数据集Astronomy-ArtTopicDocumentAnalysisDataset-debankurs
2025年5月1日 30 158 55
天文学与艺术主题文档主题分析数据集Astronomy-ArtTopicDocumentAnalysisDataset-debankurs 数据来源:互联网公开数据 标签:主题分析, 文本挖掘, 自然语言处理, 天文学, 艺术, 文档分类, 机器学习, LDA模型 数据概述:...



