数据集概述
本数据集是用于动漫流行度预测的深度学习研究数据集,基于公开互联网数据构建,包含14个文件,涵盖代码、笔记本、数据库压缩包及说明文档。数据集支持复现论文提出的融合GPT-2与ResNet-50的多模态模型,可用于分析动漫制作前可获取特征对流行度的影响,为动漫产业生产策略提供数据支撑。
文件详解
- 代码文件(.py):共6个,包括
img_inputs.py(图像输入处理)、char_inputs.py(字符输入处理)、all_inputs.py(全输入处理)、Ca_Naxca.py、trad_models.py(传统模型实现)、syn_inputs.py(合成输入处理),用于数据处理与模型构建。
- 笔记本文件(.ipynb):共6个,包括
all_inputs.ipynb(全输入分析)、img_inputs.ipynb(图像输入分析)、lcurves.ipynb(学习曲线分析)、trad_models.ipynb(传统模型分析),用于交互式数据分析与模型实验。
- 压缩包文件(.zip):
Database.zip,包含动漫流行度预测所需的数据库文件。
- 文档文件(.md):
README.md,提供数据集复现说明、仓库介绍及使用指引。
数据来源
论文“Popularity Prediction in Anime with Deep Learning”关联的GitHub仓库
适用场景
- 动漫产业流行度预测:利用多模态特征预测未上线动漫的流行度,辅助生产决策。
- 深度学习模型研究:验证融合GPT-2与ResNet-50的多模态模型在流行度预测任务中的性能。
- 特征重要性分析:探究动漫制作前可获取特征(如文本、图像)对流行度的影响程度。
- 传统与深度学习模型对比:比较传统模型与深度学习模型在动漫流行度预测中的效果差异。