癌症健康差异驱动因素BERTopic建模与PyCaret评估文本数据集

数据集概述

本数据集围绕癌症健康差异驱动因素展开,通过BERTopic建模与PyCaret评估分析PubMed癌症健康差异相关摘要文本。数据经生物信息学工具获取与预处理,聚焦社会、行为等多维度变量对癌症治疗差异的影响,为识别差异驱动因素提供支持。

文件详解

  • 文件名称: CHD.pdf:PDF格式文档,可能包含癌症健康差异驱动因素的建模分析结果、主题聚类详情及模型评估结论等内容。
  • 文件名称: Cancerhealthdisparities.zip:压缩文件,可能包含PubMed摘要原始文本数据、预处理后的文本文件、BERTopic建模与PyCaret评估的代码或中间数据文件等。

适用场景

  • 医学文本分析:用于研究癌症健康差异相关文献的主题分布与核心驱动因素。
  • 自然语言处理应用:作为BERTopic主题建模与PyCaret模型评估的实践案例数据。
  • 公共卫生研究:辅助分析不同社会、行为因素对癌症健康差异的影响机制。
  • 医疗政策制定:为制定针对性癌症健康平等策略提供数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.21 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。