法律文本关键词标注数据集LegalTextKeywordTagging-noboru9925
数据来源:互联网公开数据
标签:法律文本, 关键词标注, 文本分类, 自然语言处理, 法律法规, 数据标注, 泰语, 问答系统
数据概述:
该数据集包含来自法律文本的数据,记录了经过关键词标注的法律条文。主要特征如下:
时间跨度:数据未明确标注具体时间,可视为静态法律文本语料库。
地理范围:数据可能来源于泰国法律法规相关文本,标注语言为泰语。
数据维度:包括id、rgno、context(上下文)、pattern、question(问题)、legal_act(法律行为)、condition、rgno_id、tag_list(标签列表)等字段,其中context字段包含原始法律文本内容,tag_list字段包含标注的关键词。
数据格式:CSV格式,包含多个文件,如super3_test_title_addlistTag.csv、train_add_tag.csv等,便于文本处理和分析。
该数据集适合用于法律文本关键词提取、文本分类、法律问答系统等相关研究和应用。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于法律文本分析、自然语言处理、信息检索等领域的学术研究,如法律文本关键词识别、法律条文检索、法律知识图谱构建等。
行业应用:可以为法律科技公司、律师事务所等提供数据支持,尤其适用于智能法律助手、法律文档管理、合同审查等应用。
决策支持:支持法律法规的理解与应用,辅助法律从业者进行案例分析、法规检索和决策制定。
教育和培训:作为法律专业和自然语言处理课程的辅助材料,帮助学生和研究人员深入理解法律文本分析。
此数据集特别适合用于探索法律文本的语义结构和关键词分布规律,帮助用户实现法律文本的自动化分析和智能处理,提升法律服务效率。