俄罗斯法制文本平行语料库2008-2022

俄罗斯法制文本平行语料库2008-2022 数据来源:互联网公开数据 标签:俄罗斯法律,文本简化,平行语料库,法律文本,自然语言处理,法律历史,动态主题建模 数据概述: 本数据集收录了2008年12月31日至2022年11月28日期间的俄罗斯法制文本及其简化版本,包含2963对原始文档和简化文档。数据来源于俄罗斯政府官方报纸Rossiyskaya Gazeta,该报为俄罗斯联邦政府的官方公报,发布政府相关的事务、法令、公告等。数据集中的简化版本来自于Rossiyskaya Gazeta对重要法律文件的通俗解释“评论”,这些评论仅针对部分重要文档。 数据用途概述: 该数据集适用于法律文本简化建模、动态主题建模等应用场景。研究人员可以利用此数据集训练文本简化模型,如GPT和T5模型;还可以用于分析俄罗斯法律历史的发展趋势。此外,数据集也适用于自然语言处理领域的研究,帮助理解法律文本的简化过程和规律。 举例: 原始文档文本示例(表格第二行): (此处展示原始文档文本的具体内容) Rossiyskaya Gazeta评论示例: (此处展示Rossiyskaya Gazeta评论的具体内容)

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 23.8 MiB
最后更新 2025年4月18日
创建于 2025年4月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。