土耳其语情感分析数据集

土耳其语情感分析数据集 数据来源:互联网公开数据
标签:情感分析,土耳其语,推文,文本挖掘,机器学习,自然语言处理,社会媒体分析

数据概述:
本数据集是一个公开的土耳其语情感分析数据集,由Cagla Balli及其父亲Tahsin Balli共同创建。数据集包含两个字段:情感(正面或负面)和推文(土耳其语推文内容)。推文通过Twitter API的流方法和开源的snscrape库收集,时间范围为2020年3月至2021年3月。推文内容涉及疫苗接种、疫情相关关键词(如“aşı”、“covid”、“pandemic”等),并筛选了土耳其语推文。数据预处理包括去除噪声、转小写、删除空白以及停用词。所有推文由Tahsin Balli手动标注为正面或负面。

数据用途概述:
该数据集适用于多种场景,包括但不限于:
1. 情感分析模型的训练与验证;
2. 社交媒体情感趋势分析,特别是在疫苗接种和疫情相关话题中的公众情绪研究;
3. 机器学习算法在土耳其语文本分类中的应用测试;
4. 自然语言处理领域的学术研究与教学;
5. 市场调研与消费者情绪分析。
使用该数据集的研究需引用相关论文(论文链接)。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.18 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。