印度孟加拉语文本怀旧情感检测数据集1963-2021
数据来源:互联网公开数据
标签:怀旧检测,孟加拉语,YouTube评论,情感分析,文化研究,机器学习,深度学习
数据概述:
本数据集包含10,089条手动标注为怀旧或非怀旧的孟加拉语YouTube评论。这些评论是通过关键词如“Old Bangla Songs”和特定孟加拉语老歌名从YouTube平台上抓取的。数据集旨在支持利用机器学习和深度学习技术自动检测孟加拉语文本中的怀旧情感。怀旧是一种混合了快乐和怀旧的情感状态,其检测有助于理解数字交流中的文化与情感互动。
数据用途概述:
该数据集适用于情感分析、怀旧情感检测、文化内容分析等多种场景。研究人员可利用此数据进行情感分析,了解孟加拉语社区对老歌的情感反应;文化研究者可以研究怀旧情感在文化传承中的作用;机器学习工程师可基于数据开发怀旧情感检测模型。此外,数据集也适合用于教育培训,帮助学习者掌握情感分析和深度学习技术。
数据特征:
- 总评论数:10,089条
- 非怀旧评论数:7,461条
- 怀旧评论数:2,628条
关键字段:
- 评论:原始孟加拉语文本。
- 标签:二元分类(1 = 怀旧,0 = 非怀旧)
数据预处理详情:
- 移除了无关评论(非孟加拉语文本、内容简短或无关)
- 最小评论长度:3个词
- 清洗并分词以供模型使用
引用:
如果您使用此数据集,请引用如下:
@INPROCEEDINGS{10441174,
author={Debnath, Ameya and Karmokar, Bipul and Rahman, M. Shahidur},
booktitle={2023 26th International Conference on Computer and Information Technology (ICCIT)},
title={Automatic Nostalgia Detection from Bengali Text},
year={2023},
volume={},
number={},
pages={1-5},
keywords={Sentiment analysis;Video on demand;Social networking (online);User-generated content;Machine learning;Web sites;Videos;Nostalgia Detection;Bengali Text Analysis;Bengali Comment Collection from YouTube;Deep Learning;Machine Learning},
doi={10.1109/ICCIT60459.2023.10441174}}