MiRoR11_P2_Based_主要与报告结局提取标注语料库数据

本数据集为MiRoR11-P2项目下的标注语料库，用于主要结局与报告结局的提取任务。包含两个子文件夹，分别存储主要结局和报告结局的标注文本，支持医疗文本中结局信息的结构化提取研究，总含多格式标注文件及交叉验证子数据集。

Primary_outcomes子文件夹
ConstruKT格式单实体标注文件：po_sent_marked_p1_1000.txt（1-1000句）、po_sent_marked_p2_1000.txt（1001-2000句），将并列结局标注为单一实体
表格格式单实体标注文件：po_sent_marked_col_p1.txt（1-1000句）、po_sent_marked_col_p2.txt（1001-2000句），将并列结局标注为单一实体
表格格式多实体标注文件：po_sent_marked_col_p1_coord.txt（1-1000句）、po_sent_marked_col_p2_coord.txt（1001-2000句），将并列结局标注为独立实体
交叉验证子文件夹：po（单实体标注10折交叉验证集，含train/dev/test子集）、po_coord（多实体标注10折交叉验证集，含train/dev/test子集）
Reported_outcomes子文件夹
ConstruKT格式标注文件：res_sent_marked_p1.txt（对应主要结局1-1000句的文献结果与结论部分）、res_sent_marked_p2.txt（对应主要结局1001-2000句的文献结果与结论部分）
表格格式标注文件：res_sent_marked_p1_col.txt（第一部分）、res_sent_marked_p2_col.txt（第二部分）
交叉验证子文件夹：rep（10折交叉验证集，含train/dev/test子集）

MiRoR11-P2项目

数据与资源

字段	值
作者	Maxj
版本	1
数据集大小	4.55 MiB
最后更新	2026年1月27日
创建于	2026年1月27日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。