-
Topic_Modeling_Based_女性图书馆员相关文献主题分析数据集
数据集概述 本数据集围绕女性图书馆员相关文章的主题建模展开,包含用于NLP分析的代码文件、数据文件及文献检索查询文件,共4个文件,覆盖主题建模的核心过程与数据基础。 文件详解 代码文件 文件名称:Bertopic_Female_Lib.ipynb、scattertext.ipynb 文件格式:.ipynb...
-
business_schools_dataset_全球顶尖商学院博客分析数据
数据集概述 本数据集聚焦全球顶尖商学院博客内容分析,样本来源于三大2022年商学院排名(CEOWORLD、QS、FT)交叉筛选出的38所顶尖商学院,旨在为教育研究提供结构化的博客文本数据基础。 文件详解 文件名称:business_school_dataset.xlsx 文件格式:XLSX...
-
ICU_Soundscape_Based_患者声音体验主观评估与主题分析数据
数据集概述 本数据集对应论文及博士学位论文中的分析内容,包含ICU单人间患者对声音相关体验的主观评估与主题分析数据,涉及患者需求满足度、情绪状态及主题分类等核心信息,为ICU声景设计研究提供支撑。 文件详解 Thematic_analysis.xlsx 文件格式:XLSX...
-
BaYaka_Pygmies_无财富积累社会一夫多妻制与社交资本关系研究数据
数据集概述 本数据集围绕无财富积累的狩猎采集社会(BaYaka俾格米人)的一夫多妻制婚姻模式展开研究,分析一夫多妻制发生率、对男性生育适应性的影响,以及在无财富不平等情况下的替代解释(表型质量与社交资本)。数据用于揭示农业和财富积累出现前狩猎采集社会一夫多妻制的维持机制。 文件详解 文件名称:Chaudhary et al. public...
-
Generative_AI_Based开发者动机与心理健康影响研究补充数据包
数据集概述 本数据集为生成式AI工具对开发者动机与心理健康影响研究的补充包,包含原始研究及后续跟踪分析的数据源链接与主题分析结果,共3个文件,支持对开发者在线话语的定性研究。 文件详解 sources_selection.xlsx 文件格式:XLSX 字段映射介绍:包含研究中检索到的所有来源链接及从业者分享经验的已识别来源...
-
Stack_Exchange_Based软件工程与项目管理论坛主题分析数据集
数据集概述 本数据集为Stack Exchange平台下软件工程与项目管理社区讨论的主题分析结果,包含开发者对生产力挑战的认知、其对职业幸福感的影响及技术任务影响等内容,支持软件工程、人因学、生产力研究等领域的进一步分析,共3个文件。 文件详解 文件名称:Analysis of SE and PM Forums.xlsx 文件格式:XLSX...
-
CONTRAST_IT_Based意大利语新闻语料库数据集2011_2012
数据集概述 本数据集为CONTRAST-IT多语言语料库的意大利语部分,包含2011-2012年从意大利三家电子日报(repubblica.it、lastampa.it、corriere.it)采集的531篇真实新闻文章,总计约三十万字,覆盖政治、体育、科技等多个主题,用于多语言对比语言学研究。 文件详解 意大利语新闻文章文件...
-
PoKUS_Project_Based_克罗地亚读者文学阅读记忆访谈受限数据库
数据集概述 本数据集包含PoKUS项目中对1005名克罗地亚受访者的访谈基础信息,聚焦非专业读者对所读文学文本的概念化、使用方式及记忆情况。包含无限制数据库“ŠOR”(含书籍标题、作者等基础信息)与受限数据库(含访谈片段等细粒度数据,需验证研究用途后获取),共3个文件。 文件详解 ŠOR (unrestricted).xlsx 文件格式:XLSX...
-
普通新闻_统一教会档案_赫恩胡特_拉脱维亚斯米尔滕斯区_罗特兄弟报告_1805
数据集概述 本数据集为Unitätsarchiv Herrnhut提供的Gemein-Nachrichten数字资源的一部分,包含1805年Rothe兄弟关于拉脱维亚Smiltens区的报告转录内容。数据以XML-TEI格式和标准化文本呈现,涵盖原始转录、元数据增强转录及可用于机器分析的文本版本,总计4个文件。 文件详解 原始转录文件(Export...
-
Jack_the_Ripper_Corpus_开膛手杰克信件语料库数据v1_0
数据集概述 本数据集为开膛手杰克信件语料库v1.0,包含与开膛手杰克相关的信件文本集合,是用于历史研究和文本分析的语料资源。数据集以压缩包形式存储,未进行训练测试、数据标签或原始处理数据的拆分。 文件详解 文件名称:andreanini/jacktherippercorpus-v1.0.zip 文件格式:ZIP(压缩包)...
-
PACO_Based_哥伦比亚透明度秘书处反腐败新闻整合数据2020_2023
数据集概述 本数据集为2020-2023年哥伦比亚反腐败门户网站(PACO)收录的腐败相关新闻整合数据,由哥伦比亚透明度秘书处提供。数据涵盖该时间段内平台登记的腐败新闻信息,是研究哥伦比亚反腐败监督及腐败事件动态的结构化资料。 文件详解 文件名称:NOTICIAS_PACO-CONSOLIDADO V2.xlsx 文件格式:XLSX...
-
a0752_musiXplora_Philipp_Angerer_生平记录数据
数据集概述 本数据集记录了音乐家Philipp Angerer(musiXplora-ID:a0752)的生平信息,包括姓名、性别、宗教信仰、活跃时间、行业领域、职业身份、活动地点、家庭关系及作品分类等核心内容,为研究该历史音乐家提供结构化参考数据。 文件详解 文件名称:a0752_DE.json 文件格式:JSON...
-
SophiA_Casa_dos_Contos_FBN_巴西财政历史文档馆藏数据
数据集概述 本数据集是巴西国家图书馆基金会Casa dos Contos文档馆藏的不完全清单,包含一万一千一百六十八条文档摘要记录,占SophiA平台巴西国家数字档案馆该馆藏总记录(一万二千零四十三条)的百分之九十三。该馆藏是巴西财政史上最重要的档案之一,涵盖一七零一年至一八八九年米纳斯吉拉斯地区的财政相关文档,已全部数字化并在线开放。 文件详解...
-
EHRI_MASI_Test_Dataset_大屠杀档案多语言主题标引测试数据
数据集概述 本数据集包含源自大屠杀相关档案材料描述的文本,每条文本关联EHRI Terms受控词表中的一个或多个主题术语,用于支持多语言自动主题标引的对比研究,可复现论文中的实验结果。 文件详解 文件名称:ehri-masi-dataset-main.zip 文件格式:ZIP 字段映射介绍:压缩包内包含与大屠杀档案相关的文本数据,每条文本关联EHRI...
-
Serverless_Based_无服务器计算演化研究_计算文献综述_复制包数据
数据集概述 本数据集是“Understanding the Evolution of Serverless Computing: A Computational Literature Review”研究的复制包,包含Scopus数据集及基于主题建模的最终分析结果,通过LDA等技术识别学术文献中的主题集群,助力无服务器计算领域的可重复研究与进一步探索。...
-
Global_Stocktake_Based全球气候行动进展多语言机器学习分析数据
数据集概述 本数据集为《Progress on Climate Action: a Multilingual Machine Learning Analysis of the Global Stocktake》一文的配套数据,包含全球盘点气候行动相关的文本嵌入、文档项、主题关键词及段落、降维嵌入和元数据概述,支持气候变化领域的多语言文本分析研究。...
-
气候书籍_如何避免气候灾难_格蕾塔_通贝里与比尔_盖茨著作的修辞框架与主题分析数据
数据集概述 本数据集包含用于分析Greta Thunberg《The Climate Book》与Bill Gates《How to Avoid a Climate Disaster》两本书籍修辞框架的编码及引述内容,通过结构化整理支持对气候议题相关文本修辞策略的研究。 文件详解 文件名称:Codes and Quotes for Analysis...
-
DefinitionsOfInteroperability_文献研究互操作性定义数据
数据集概述 本数据集整理了来自文献的不同互操作性定义,为研究人员提供结构化的互操作性概念参考资料,帮助理解该领域的核心定义体系。数据集仅包含一个文件。 文件详解 文件名称:DefinitionsOfInteroperability.xlsx 文件格式:XLSX...
-
Allegato_1_Based_社会机器人技术定义锚点与参考文献_叙事综述补充数据
数据集概述 本数据集是社会机器人技术叙事综述的补充文档,包含社会机器人技术的定义锚点、研究结果中浮现的三个核心概念节点及相关参考来源,为社会机器人技术的文献分析提供结构化参考资料。 文件详解 文件名称:Allegato 1_Ancoraggi definitori e bibliografici.docx 文件格式:DOCX...
-
AI_E_commerce_Based_人工智能在电子商务中应用关系混合方法分析数据
数据集概述 本数据集为研究AI与电子商务关系的文献分析数据,基于混合方法(文献计量与系统文献综述)整理,包含1个Excel文件,用于支持相关领域的文献研究与分析,暂无更多详细描述。 文件详解 文件名称:Revealing the Relationship of AI in E-Commerce Through a Mixed-Methods...



