数据集

土耳其语情感分析数据集

土耳其语情感分析数据集数据来源：互联网公开数据
标签：情感分析,土耳其语,推文,文本挖掘,机器学习,自然语言处理,社会媒体分析

数据概述：
本数据集是一个公开的土耳其语情感分析数据集，由Cagla Balli及其父亲Tahsin Balli共同创建。数据集包含两个字段：情感（正面或负面）和推文（土耳其语推文内容）。推文通过Twitter API的流方法和开源的snscrape库收集，时间范围为2020年3月至2021年3月。推文内容涉及疫苗接种、疫情相关关键词（如“aşı”、“covid”、“pandemic”等），并筛选了土耳其语推文。数据预处理包括去除噪声、转小写、删除空白以及停用词。所有推文由Tahsin Balli手动标注为正面或负面。

数据用途概述：
该数据集适用于多种场景，包括但不限于：
1. 情感分析模型的训练与验证；
2. 社交媒体情感趋势分析，特别是在疫苗接种和疫情相关话题中的公众情绪研究；
3. 机器学习算法在土耳其语文本分类中的应用测试；
4. 自然语言处理领域的学术研究与教学；
5. 市场调研与消费者情绪分析。
使用该数据集的研究需引用相关论文（论文链接）。

数据与资源

土耳其语情感分析数据集.zipZIP
0.18 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.18 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

土耳其语情感分析数据集

数据与资源

附加信息

注册成功！