找到3个数据集

分类: 公开数据 标签: Word2Vec

过滤结果
  • Exploiting_Hierarchy_医疗概念嵌入_ICD_10分层数据集

    2026年1月19日 30 196 14

    数据集概述 本数据集包含基于ICD-10编码标准构建的预训练医疗概念嵌入,通过扩展Word2Vec算法融入医疗编码的分层信息。数据来自美国中大西洋地区大型综合医疗机构约60万患者的数据集,包含ICD-10代码和CCSR分类的嵌入向量,可用于医疗数据分析与分类任务,共包含2个文件。 文件详解 README.md 文件格式:MD...
    packageimg
  • Board_Leadership_Based美国上市公司董事会领导力数据库及机器学习扩展脚本2025

    2026年1月4日 30 68 11

    数据集概述 本数据集包含美国上市公司董事会领导力数据库及配套机器学习脚本,数据库通过监督学习扩展人工编码数据生成,涵盖CEO二元性、董事会主席定位等变量;脚本用于训练模型及对企业委托书相关变量评分,支持其他结构数据的扩展应用,共9个文件。 文件详解 文档文件 文件名称:Board Leadership Dataset & Tool...
    packageimg
  • 架构侵蚀违规症状自动化识别研究复现包

    2025年12月21日 30 4 1

    数据集概述 本数据集为架构侵蚀违规症状自动化识别研究的复现包,包含代码审查评论数据、特征文件、预训练词嵌入模型下载链接、实验脚本及开发者调查访谈资料,支持复现机器学习、深度学习及大语言模型分类器实验。 文件详解 该数据集由三个压缩文件构成,具体说明如下: - 数据文件包: data.zip - 内容说明:包含特征文件、预训练词嵌入模型下载链接及标注数据...
    packageimg