开发者情感分析基准研究数据集

数据集概述

该数据集是一项关于软件提交信息情感与情绪分析的基准研究数据,包含实验代码、预处理脚本、模型实现文件、数据压缩包及标注指南文档,为分析开发者在代码提交过程中的情感倾向提供技术实现与数据支持。

文件详解

  • 代码文件(.ipynb格式,共11个):
  • sentiment_PLMs.ipynb:基于预训练语言模型(PLMs)的情感分析实验代码
  • preprocess.ipynb:数据预处理流程代码
  • baseline.ipynb:基准模型实现代码
  • ensemble_confidence.ipynb:带置信度的集成模型代码
  • LSTM.ipynb、sentiment-LSTM.ipynb:长短期记忆网络(LSTM)模型实现代码
  • ensemble.ipynb:模型集成方法代码
  • 压缩包文件(.zip格式,共2个):
  • bin.zip:可能包含二进制文件或依赖库压缩包
  • data.zip:研究使用的原始或处理后数据集压缩包
  • 文档文件(.pdf格式,1个):
  • Annotation Guideline.pdf:情感标注的指导方针文档

适用场景

  • 软件工程情感分析:研究软件提交信息中的开发者情感倾向与项目质量关联
  • 自然语言处理(NLP)应用:测试预训练语言模型、LSTM等在技术文本情感分析任务中的性能
  • 基准模型构建:为软件提交信息情感分析任务建立基线模型与评估标准
  • 代码开发过程研究:分析开发者情绪变化对代码提交频率或质量的影响
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 12.78 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。