数据集

端到端自然语言生成餐厅领域挑战数据集-2017-mexwell

端到端自然语言生成餐厅领域挑战数据集-2017-mexwell 数据来源：互联网公开数据标签：自然语言生成,NLG,端到端,数据驱动,餐厅领域,挑战数据集,文本生成数据概述：本数据集是用于训练端到端、数据驱动的自然语言生成系统在餐厅领域的E2E数据集，其规模是现有常用数据集的十倍。E2E数据集提出了新的挑战：其人类参考文本展示了更丰富的词汇和更广泛的句法变化，包括语篇现象；从该数据集中生成文本需要内容选择。因此，从该数据集中学习有望生成更自然、多变且不那么模板化的系统句子。数据集包含以下文件： trainset.csv – 训练集 devset.csv – 开发集 testset.csv – 挑战测试集（仅包含表示） testset_w_refs.csv – 带参考自然语言句子的评估测试集数据用途概述：该数据集适用于自然语言生成系统的研究和开发，特别是在餐厅领域的应用。研究人员可以利用该数据集训练和评估端到端生成模型，提高生成文本的自然性和多样性。此外，该数据集也可用于教学和演示，帮助学生和教师理解自然语言生成的复杂性和挑战。

数据与资源

versions_20250401072851.zipZIP
1.46 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.46 MiB
最后更新	2025年4月22日
创建于	2025年4月22日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。