数据集概述
本数据集包含基于RoBERTa和GPT-2模型的现代法语诗歌生成研究的人工评估结果及被评估诗歌文本,对应2022年国际计算创造力会议论文。数据分为原始评估数据和聚合结果两类文件,支持对诗歌生成模型的质量评估与分析。
文件详解
- 评估结果文件(evaluation_results.xlsx)
- 文件格式:XLSX
- 字段映射介绍:包含人工评估的原始数据(不含评估者IP地址),记录诗歌生成模型输出文本的人工评分细节
- 聚合结果文件(a1926592.csv)
- 文件格式:CSV
- 字段映射介绍:包含_unit_id(评估单元ID)、_unit_state(评估状态)、_trusted_judgments(可信判断数)、q_1至q_6(6项评估问题得分)及对应stddev(标准差)、id(诗歌ID)、poem(诗歌文本)、q_1_gold至q_5_gold(5项评估问题的参考标准得分)等字段
数据来源
论文“Hämäläinen, M., Alnajjar, K., & Poibeau, T. (2022) Modern French Poetry Generation with RoBERTa and GPT-2. In The Proceedings of the 13th International Conference on Computational Creativity.”
适用场景
- 自然语言处理模型评估:分析RoBERTa和GPT-2模型在法语诗歌生成任务中的性能表现
- 计算创造力研究:探究机器生成诗歌的创造性、流畅性等人工评估维度特征
- 诗歌生成质量分析:基于人工评分数据优化诗歌生成模型的训练策略
- 自然语言处理学术研究:为现代法语诗歌生成相关研究提供基准评估数据支持