找到3个数据集

分类: 公开数据 标签: GPT2

过滤结果
  • Reddit_Comments_Dataset_文本风格迁移任务评论数据集

    2026年1月21日 30 133 124

    数据集概述 本数据集为文本风格迁移任务准备,包含Reddit评论及其正式语言翻译。数据来自20个Subreddits,通过GPT-2筛选高困惑度评论进行翻译,分为原始评论、带标签翻译及带风格示例的翻译文件,共5个文件,支持风格迁移模型训练与评估。 文件详解 reddit_comments.csv 文件格式:CSV...
    packageimg
  • RoBERTa_GPT_2_Based现代法语诗歌生成模型人工评估数据_2022

    2026年1月19日 30 198 137

    数据集概述 本数据集包含基于RoBERTa和GPT-2模型的现代法语诗歌生成研究的人工评估结果及被评估诗歌文本,对应2022年国际计算创造力会议论文。数据分为原始评估数据和聚合结果两类文件,支持对诗歌生成模型的质量评估与分析。 文件详解 评估结果文件(evaluation_results.xlsx) 文件格式:XLSX...
    packageimg
  • Anime_Popularity_Prediction_Based_动漫流行度预测深度学习数据集

    2026年1月9日 30 150 92

    数据集概述 本数据集是用于动漫流行度预测的深度学习研究数据集,基于公开互联网数据构建,包含14个文件,涵盖代码、笔记本、数据库压缩包及说明文档。数据集支持复现论文提出的融合GPT-2与ResNet-50的多模态模型,可用于分析动漫制作前可获取特征对流行度的影响,为动漫产业生产策略提供数据支撑。 文件详解...
    packageimg