多文档摘要对话语料集

多文档摘要对话语料集 数据来源:互联网公开数据
标签:多文档摘要,对话结构,元评论生成,学术论文,自然语言处理,文本摘要,机器学习

数据概述:
本数据集主要用于多文档摘要任务,每个样本包含以下字段信息:论文ID(指向原始数据的链接)、论文标题、论文摘要、论文接受情况、元评论、审稿人ID、审稿人姓名、审稿内容、审稿评分、审稿置信度、审稿回复内容以及标签(用于区分训练集、验证集和测试集)。数据集来源于2023年发表的研究成果,旨在通过多文档的对话结构生成高质量的元评论。

数据用途概述:
该数据集适用于多文档摘要任务的研究与开发,特别适合用于元评论生成模型的训练与优化。研究人员可以利用此数据集探索如何从多个文档中提取关键信息并生成连贯的摘要。此外,数据集还可用于自然语言处理领域的学术研究,如对话结构分析、文本摘要评估以及机器学习模型的性能测试。数据集的结构化设计使其适用于多种应用场景,能够为学术界和工业界提供有价值的研究支持。

参考文献:
李苗, 埃德华·霍夫, 杰汉·劳. 《基于对话结构的多文档摘要生成元评论的研究》. 2023年EMNLP会议论文集.

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 130.37 MiB
最后更新 2025年4月27日
创建于 2025年4月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。