-
NUBUC_Based_语境控制口语故事语料库数据
2026年1月31日 30 149 87
数据集概述 本数据集为NyU-BU语境控制故事语料库(NUBUC),是兼顾自然性与实验可控性的口语语料库。包含8个独特故事的16段高质量录音,由男女演员各录制一遍,每故事含128句约2000词,围绕关键词构建,关键词在多语言维度匹配,语境参数(先验/局部语境强弱、句子位置早晚)被操控。 文件详解 文件名称:public.zip 文件格式:ZIP...
-
ICWE2025_Supplementary_研究数据分类关键词标注评估数据
2026年1月20日 30 126 35
数据集概述 本数据集为论文《Taxonomy-based Keyword Annotation of Research Data》的补充数据,用于评估研究数据的分类关键词标注效果。数据包含不同分类法的类别覆盖分数,具体计算方式可参考原文,支持研究数据标注方法的性能验证与分析。 文件详解 文件名称:category coverage...
-
法律文本关键词标注数据集LegalTextKeywordTagging-noboru9925
2025年4月29日 30 97 15
法律文本关键词标注数据集LegalTextKeywordTagging-noboru9925 数据来源:互联网公开数据 标签:法律文本, 关键词标注, 文本分类, 自然语言处理, 法律法规, 数据标注, 泰语, 问答系统 数据概述: 该数据集包含来自法律文本的数据,记录了经过关键词标注的法律条文。主要特征如下:...



