YouTube_API_Based_马拉地语食谱频道评论标注数据集

数据集概述

本数据集通过YouTube API采集马拉地语食谱频道评论,覆盖Anjali Recipe Marathi等12个热门频道。评论经人工标注为感谢、食谱相关、视频相关、赞扬、混合、未定义、建议与查询7类,包含标注类别及对应样本量,为分析马拉地语食谱频道用户互动提供结构化数据。

文件详解

  • 数据文件
  • 文件名称:devnagiri.csv
  • 文件格式:CSV
  • 字段映射介绍:包含Channel(频道名称)、Comment(评论内容,天城文书写)、Label(标注类别,对应7类标签编码)
  • 文件名称:marathi in english.csv
  • 文件格式:CSV
  • 字段映射介绍:包含Channel(频道名称)、Comment(评论内容,马拉地语转写为英语字母)、Label(标注类别,对应7类标签编码)
  • 文档文件
  • 文件名称:readme-Final-devanagiri.docx
  • 文件格式:DOCX
  • 内容说明:关于天城文版本数据的说明文档
  • 文件名称:readme-Final-marathi+english.docx
  • 文件格式:DOCX
  • 内容说明:关于马拉地语转写英语字母版本数据的说明文档

数据来源

YouTube API采集的Top Marathi Recipe频道评论

适用场景

  • 社交媒体用户互动分析: 研究马拉地语食谱频道用户评论的情感倾向与互动类型分布
  • 食谱内容优化: 基于"关于食谱"类评论挖掘用户对食谱的关注点与需求
  • 视频内容改进: 通过"关于视频"类评论分析用户对视频制作的反馈,优化视频呈现形式
  • 用户需求挖掘: 利用"建议与查询"类评论识别用户未被满足的需求,指导内容创作方向
  • 多语言文本标注研究: 作为人工标注的多类别评论数据集,用于自然语言处理模型训练与评估
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.8 MiB
最后更新 2026年1月27日
创建于 2026年1月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。