数据集概述
本数据集包含两个.xlsx格式的文件,用于评估大型语言模型(LLMs)在个性化冷邮件生成任务中的表现。数据集基于招聘信息,分别使用详细提示词和基础提示词生成冷邮件,记录了招聘信息、生成邮件内容、个人化字段及提示词参考等信息。
文件详解
- 数据集1:all_model_evaluation_P1.xlsx
- 文件格式:.xlsx
- 字段映射:每一行对应一个招聘信息→生成邮件对,包含Job URL、Job Role、Skills、Description、Generated Email、Personalization Fields、Prompt Reference等字段。
- 数据集2:all_model_evaluation_P2.xlsx
- 文件格式:.xlsx
- 字段映射:每一行对应一个招聘信息→生成邮件对,包含Job URL、Job Role、Skills、Description、Generated Email、Personalization Fields、Prompt Reference等字段。
适用场景
- LLM性能评估:对比LLM在结构化提示词和基础提示词下的表现。
- 提示词工程研究:分析提示词详细程度对生成文本个性化和专业性的影响。
- 个性化沟通研究:用于研究提示词工程、噪声鲁棒性、信息整合及个性化沟通。
- 模型训练:作为冷邮件生成模型的训练/测试数据集。