UC伯克利FrameNet语义标注评估数据集-2023-rohanhbtu

UC伯克利FrameNet语义标注评估数据集-2023-rohanhbtu 数据来源:互联网公开数据 标签:FrameNet,语义标注,评估,自然语言处理,NLP,文本分析,UC伯克利,Frame层,XML,问答对

数据概述: 本数据集包含UC伯克利FrameNet语料库的完整文本注释数据,专注于Frame层的真值标注。数据以问答对的形式呈现,并提供两种格式的文件:Pickle和CSV。推荐使用Pickle文件,因其直接存储为可使用的JSON格式,而CSV文件则以字符串形式存储数据,需要额外的转换步骤才能转换为JSON格式。

数据集中的问答对涵盖了从原始文本到Frame层标注的映射关系,便于评估和验证FrameNet的标注准确性。数据来源为UC伯克利FrameNet的完整文本注释XML文件。

数据用途概述: 该数据集适用于自然语言处理(NLP)研究、语义标注性能评估、文本分析等多种场景。研究者可以利用此数据集进行FrameNet标注的验证和改进;开发者可以将其用于构建和优化语义标注工具;教育者可以利用这些问答对进行教学和演示,帮助学生理解FrameNet框架及其应用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.64 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。