端到端自然语言生成餐厅领域挑战数据集-2017-mexwell

端到端自然语言生成餐厅领域挑战数据集-2017-mexwell 数据来源:互联网公开数据 标签:自然语言生成,NLG,端到端,数据驱动,餐厅领域,挑战数据集,文本生成 数据概述: 本数据集是用于训练端到端、数据驱动的自然语言生成系统在餐厅领域的E2E数据集,其规模是现有常用数据集的十倍。E2E数据集提出了新的挑战:其人类参考文本展示了更丰富的词汇和更广泛的句法变化,包括语篇现象;从该数据集中生成文本需要内容选择。因此,从该数据集中学习有望生成更自然、多变且不那么模板化的系统句子。 数据集包含以下文件: trainset.csv – 训练集 devset.csv – 开发集 testset.csv – 挑战测试集(仅包含表示) testset_w_refs.csv – 带参考自然语言句子的评估测试集 数据用途概述: 该数据集适用于自然语言生成系统的研究和开发,特别是在餐厅领域的应用。研究人员可以利用该数据集训练和评估端到端生成模型,提高生成文本的自然性和多样性。此外,该数据集也可用于教学和演示,帮助学生和教师理解自然语言生成的复杂性和挑战。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.46 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。