数据集

DIPROMATS_2024_Shared_Task_2_叙事识别小样本训练数据

数据集概述

本数据集是DIPROMATS 2024共享任务2的小样本训练数据，用于叙事识别任务。叙事是指有因果联系的事件序列，在国际关系领域，国际行为体通过战略叙事构建国际政治的过去、现在和未来的共同意义。数据集包含英文和西班牙文两种语言的训练数据，共2个文件。

文件详解

文件名称：dipromats24_t2_train_en_ids.json
文件格式：JSON
字段映射介绍：英文小样本训练数据，包含与叙事相关的推文样本及对应叙事标识信息。
文件名称：dipromats24_t2_train_es_ids.json
文件格式：JSON
字段映射介绍：西班牙文小样本训练数据，包含与叙事相关的推文样本及对应叙事标识信息。

数据来源

Peñas, A., Fraile-Hernández, J. M., Moral, P., Rodrigo, Á., Deriu, J., Sharma, R., Centeno, R., Rodríguez-García, R., Giedemann, P., & Reyes-Montesinos, J. (2024). DIPROMATS 2024 - Shared Task 2: testing data for narrative identification (1.0.0) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.12663310

适用场景

自然语言处理模型训练: 用于训练小样本学习模型，完成叙事识别的多类别多标签分类任务。
国际关系文本分析: 分析推文中国际行为体的战略叙事内容及传播特点。
跨语言叙事研究: 对比英文和西班牙文推文中叙事的表达差异和识别难度。
多标签分类算法评估: 测试不同算法在小样本条件下对叙事识别任务的性能表现。

数据与资源

10820961.zipZIP
0.05 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	0.05 MiB
最后更新	2026年1月19日
创建于	2026年1月19日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。