-
CLS_INFRA_T3_5_学术界外用户需求访谈数据集
2025年12月22日 30 14 7
数据集概述 本数据集包含都柏林大学三一学院CLS INFRA研究团队针对学术界外专业人士开展的十五份访谈记录及相关材料,旨在了解其对计算文学研究基础设施的需求,为基础设施可持续性与影响力提升提供依据。 文件详解 访谈转录文件:...
-
多语言多领域文本属性数据集
2025年12月22日 30 55 29
数据集概述 该数据集专为真实文档中的词级文本属性识别设计,包含1623张真实文档图像(涵盖法律通知、土地记录等多领域),覆盖8种语言,提供1117716个词级标注,标注类型包括粗体、斜体等文本属性及正常文本。 文件详解 测试集文件:MMTAD-TESTSET.zip,格式为ZIP,包含测试集数据 模型文件:TEXTAR-...



