-
ALT_Based_亚洲语言树库项目缅甸语树库数据
2026年1月31日 30 13 2
数据集概述 本数据集是亚洲语言树库(ALT)项目下的缅甸语树库,包含约2万句从英文维基新闻翻译而来的缅甸语句子,由NICT和UCSY联合开发,遵循CC BY-NC-SA 4.0许可协议,为缅甸语自然语言处理研究提供结构化语料资源。 文件详解 压缩文件 文件名称:my-alt-190530.zip 文件格式:ZIP...
-
AnCora_西班牙语多层面标注语料库数据3_0_1
2026年1月31日 30 112 14
数据集概述 本数据集为AnCora 3.0.1西班牙语语料库,包含约50万字的新闻文本,覆盖词元、词性、句法成分、论元结构、动词语义类、名物化隐含论元等多层面标注,支持自然语言处理相关研究与应用。 文件详解 文件名称:AnCora 3.0.1 Spanish.zip 文件格式:ZIP...
-
PropBank数据库与SentenceBERT嵌入数据集
2025年12月22日 30 126 45
数据集概述 本数据集是包含SentenceBERT嵌入的PropBank数据库,用于论文“CALAMR: Component ALignment for Abstract Meaning Representation”。数据库涵盖角色、角色集等PropBank数据及示例、描述、函数等嵌入信息,支持独立使用或通过zensols.propbankdb...
-
西班牙语历时词用法图数据集DWUG_ES
2025年12月5日 30 120 118
数据集概述 该数据集包含西班牙语的历时词用法图(WUGs),提供词用法随时间变化的结构化数据,支持语义变化研究。版本为4.0.2,含修正后的词上下文、索引及匿名化标注,通过压缩包形式存储。 文件详解 文件名称:dwug_es.zip 文件格式:ZIP压缩包...



