AI相关推文情感分类数据集

AI相关推文情感分类数据集 数据来源:互联网公开数据 标签:AI,推文,情感分析,自然语言处理,机器学习,数据标注,人类评估

数据概述: 本数据集包含经过处理的文本数据,旨在为大型语言模型的训练提供合适的提示。这些提示集成了预期的输出,常用于语言模型的监督微调。提示结构化为明确的输入-输出对,以高效指导模型的学习过程。模型生成文本后,通过分析内容确定所表达的情感,并据此为每个推文标注正确的情感。情感分类的标准如下: - 包含“positively”一词的推文被标注为正面情感。 - 包含“negatively”一词的推文被标注为负面情感。 - 包含“neutral”一词的推文被标注为中性情感。

此外,数据集还包含由人类专家标注的基准,作为评估各种建模策略的标准。十名具有软件工程、人工智能背景,并持有计算机科学博士学位的专家评估了推文。他们关注推文可能对人工智能产生的潜在影响(中性、正面或负面),以反映现实世界中AI应用的场景。此人类标注的基准有助于将模型性能与手动策划的标准进行比较。

数据集包含约20,000条推文,涵盖了与AI相关的各种话题,如“AI Danger”(AI危险)、“AI Ethics”(AI伦理)、“AI Problems”(AI问题)、“AI Creating Problem on Jobs”(AI对就业造成的问题)、“AI Threat”(AI威胁)、“AI Using on war”(AI用于战争)、“AI bot problems”(AI机器人问题)、“AI Problems for Students”(学生面临的AI问题)等。

数据用途概述: 该数据集适用于情感分析、自然语言处理研究、机器学习模型的训练与评估以及教育培训等多种场景。研究人员可以利用此数据集进行模型训练和微调,以提高语言模型对AI相关推文情感的理解能力。此外,数据集中的基准注释可用于评估模型性能,并为实际应用中的情感分类提供参考标准。教育机构和培训项目也可以使用此数据集来教授情感分析和自然语言处理的相关知识。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.07 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。