数据集

越南法律问答数据集

越南法律问答数据集_Vietnam_Legal_Question_Answering_Dataset

数据来源：互联网公开数据

标签：法律问答, 自然语言处理, 文本检索, 问答系统, 越南法律, 机器阅读理解, 数据集, 文本分析

数据概述：该数据集包含来自越南法律领域的问答数据，旨在支持越南语法律文本的机器阅读理解和问答系统开发。主要特征如下：时间跨度：数据未明确标注时间，可视为静态法律知识库。地理范围：数据涵盖越南法律法规相关内容。数据维度：包括“question”（问题）和“context”（上下文，仅在训练集中提供，用于提供问题的答案）以及“cid”（上下文标识符）和“qid”（问题标识符）。此外，还包含finetuned_legal_tokenizer文件夹，内含模型tokenizer相关的配置文件。数据格式：主要为CSV格式，包括train.csv，public_test.csv，corpus.csv等文件，并包含用于tokenizer的.json、.txt文件和模型.pth文件，方便进行文本处理、模型训练和评估。来源信息：数据来源于越南法律法规相关的公开资料，已进行数据清洗和标注。该数据集适合用于越南语法律问答系统的研发、文本检索、信息抽取等研究，以及相关机器学习模型的训练和评估。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于自然语言处理、信息检索、机器阅读理解等领域的学术研究，特别是针对越南语文本的研究。行业应用：可以为法律科技公司、法律咨询平台提供数据支持，用于构建智能法律问答系统、法律文本检索工具等。决策支持：支持法律从业者快速获取法律信息，提高工作效率，辅助法律决策。教育和培训：作为法律专业学生和研究人员的实践材料，帮助他们了解和掌握越南法律知识，以及相关的人工智能技术。此数据集特别适合用于构建越南法律领域的问答系统，实现对法律法规的快速查询和理解，提高信息获取效率，并促进越南法律领域的数字化转型。

数据与资源

越南法律问答数据集_Vietnam_Legal_Question_Answering_Dataset.zipZIP
548.50 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	548.5 MiB
最后更新	2025年10月28日
创建于	2025年10月28日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

越南法律问答数据集

数据与资源

附加信息

注册成功！