数据集概述
本数据集为年龄包容性移动应用评论研究项目的相关文件集合,包含用户评论的人工标注数据、基于GPT、Gemini、LLAMA等模型的自动标注结果,以及对应的分析代码笔记本和说明文档,用于支持移动应用评论的年龄包容性研究。
文件详解
- 文档文件
- 文件名称:README.txt.md
- 文件格式:.md
- 字段映射介绍:项目说明文档,概述数据集包含的文件及用途
- 数据文件
- 文件名称:Annotation - RQ1.xlsx
- 文件格式:.xlsx
- 字段映射介绍:包含RQ1研究问题的人工标注数据
- 文件名称:Annotation - RQ2.xlsx
- 文件格式:.xlsx
- 字段映射介绍:包含RQ2研究问题的人工标注数据
- 文件名称:GPT_Generated_Labels.xlsx
- 文件格式:.xlsx
- 字段映射介绍:GPT模型生成的评论标签数据
- 文件名称:Gemini_Generated_Labels.xlsx
- 文件格式:.xlsx
- 字段映射介绍:Gemini模型生成的评论标签数据
- 文件名称:LLAMA_Generated_Labels.xlsx
- 文件格式:.xlsx
- 字段映射介绍:LLAMA模型生成的评论标签数据
- 代码文件
- 文件名称:GPT_Analysis.ipynb
- 文件格式:.ipynb
- 字段映射介绍:GPT模型标签生成的代码笔记本,包含零样本和少样本实验的提示词设计
- 文件名称:Gemini_Analysis.ipynb
- 文件格式:.ipynb
- 字段映射介绍:Gemini模型相关分析的代码笔记本
- 文件名称:LLAMA_Analysis.ipynb
- 文件格式:.ipynb
- 字段映射介绍:LLAMA模型相关分析的代码笔记本
- 文件名称:Roberta_exp.ipynb
- 文件格式:.ipynb
- 字段映射介绍:基于Roberta模型的实验代码笔记本
- 文件名称:Traditional_Classifier.ipynb
- 文件格式:.ipynb
- 字段映射介绍:传统分类器的实验代码笔记本
适用场景
- 移动应用评论年龄包容性研究:通过人工标注和自动标注数据,分析不同年龄用户对移动应用的评论特征
- 大语言模型文本标注能力评估:对比GPT、Gemini、LLAMA等模型在移动应用评论标注任务中的表现
- 零样本与少样本学习实验:基于GPT分析代码笔记本,开展自然语言处理任务的零样本、少样本实验设计
- 传统分类器与大模型性能对比:通过传统分类器代码笔记本,对比传统机器学习方法与大语言模型在评论分析任务中的效果