ClinSpEn_CT_Based_平行英西生物医学术语数据_2022

数据集概述

本数据集为ClinSpEn-Clinical Terms子任务的样本、测试及背景数据,方向为西班牙语到英语(ES>EN)翻译。术语源自医学文献和临床记录,聚焦疾病、症状等类别,由专业医疗译者翻译修订,支持生物医学领域机器翻译系统开发与评估。

文件详解

  • 文件名称:clinspen_clinicalterms_sample+test+bg.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包包含样本集、测试集和背景数据。样本集为TSV格式,含两列(英文术语、西班牙语术语);测试与背景数据为TSV格式,含两列(术语编号、西班牙语术语)。

数据来源

ClinSpEn-Clinical Terms子任务,相关链接:https://doi.org/10.5281/zenodo.6497372

适用场景

  • 生物医学机器翻译模型训练: 用于开发和优化西班牙语到英语的医学术语翻译系统。
  • 医学术语标准化研究: 分析英西生物医学术语的对应关系,支持跨语言术语统一。
  • 医疗翻译质量评估: 作为测试集评估生物医学翻译模型的准确性和专业性。
  • 临床文档跨语言处理: 辅助多语言临床记录、医学文献的术语对齐与内容转换。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.11 MiB
最后更新 2026年1月26日
创建于 2026年1月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。