欧洲议会议事录说话者性别与年龄注释数据集

欧洲议会议事录说话者性别与年龄注释数据集 数据来源:互联网公开数据
标签:欧洲议会,说话者属性,性别,年龄,机器翻译,个性化翻译,平行语料库,自然语言处理
数据概述:
本数据集是对欧洲议会议事录的注释版本,标注了说话者的性别和年龄信息,注释粒度为句子级别。数据集包含英语-法语和英语-德语两个平行语料库,为研究个性化机器翻译提供了高质量的数据基础。
数据用途概述:
该数据集适用于个性化机器翻译研究,特别是在自动翻译过程中保留说话者性别特征的场景。研究人员可利用此数据集进行跨语言分析,探索性别和年龄对翻译质量的影响;企业可基于数据优化翻译模型,提升翻译的准确性和自然度。此外,数据集也适合用于自然语言处理领域的教育和培训,帮助学习者理解跨语言特征的处理方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 761.02 MiB
最后更新 2025年6月4日
创建于 2025年6月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。