数据集概述
本数据集包含XYZ食品评论的原始数据、处理后数据及相关实验代码,涵盖数据处理、模型训练与实验测试三部分内容,支持食品评论相关的自然语言处理研究,共含5个文件。
文件详解
- 数据文件
- 文件名称:Full Raw Dataset.csv
- 文件格式:CSV
- 字段映射介绍:包含id(唯一标识)、review(评论内容)、rating(评分)、createdAt(创建时间)、lastComment(最后评论)、qtyItem(商品数量)、orderedAt(下单时间)、orderItem(订单商品)、tagsData(标签数据)、replayComment(回复评论)、timeReplayComment(回复时间)等字段
- 文件名称:Sorted and Modified Dataset.xlsx
- 文件格式:XLSX
- 字段映射介绍:研究中使用的经过排序与修改的数据集,具体字段基于原始数据优化(未提供详细映射)
- 代码文件
- 文件名称:Fine_Tuned_T5.ipynb
- 文件格式:IPYNB
- 字段映射介绍:研究用T5模型微调代码,用于食品评论相关AI模型训练
- 文件名称:Eksperimen_1_T5_(Keyword_Akhir).ipynb
- 文件格式:IPYNB
- 字段映射介绍:第一个AI模型实验测试代码,含关键词相关实验逻辑
- 文件名称:Eksperimen_2_T5.ipynb
- 文件格式:IPYNB
- 字段映射介绍:第二个AI模型实验测试代码,用于验证模型性能
数据来源
Kaggle平台Ian Narsa发布的数据集
适用场景
- 食品评论情感分析: 利用评论内容与评分数据,训练和测试情感倾向分类模型
- NLP模型优化: 通过T5模型微调代码,研究食品评论领域的文本处理模型优化
- 消费行为分析: 结合评论数据与订单信息,分析用户消费偏好与评价规律
- 实验复现与验证: 基于两个实验代码,复现食品评论AI模型的实验过程与结果验证