IT支持工单分类数据集

数据集概述

该数据集包含2229条由巴西弗洛里亚诺波利斯地区IT支持公司提供的工单,经人工分类为7个类别,涵盖多语言非结构化文本。数据已脱敏处理,包含模型训练相关文件、数据文件及分析结果文件。

文件详解

  • 数据文件(CSV格式):
  • X_train.csv:训练集特征数据文件,存储工单文本数据
  • X_test.csv:测试集特征数据文件,存储工单文本数据
  • y_train.csv:训练集标签数据文件,字段包括id(工单ID)、category_truth(真实分类类别)
  • y_test.csv:测试集标签数据文件,字段包括id(工单ID)、category_truth(真实分类类别)
  • 模型相关文件:
  • vlatest_model.h5:模型文件,H5格式
  • vlatest_encoder.pickle:编码器文件,Pickle格式
  • vlatest_tokenizer.pickle:分词器文件,Pickle格式
  • 分析与结果文件:
  • distributions.txt:统计分布文件,TXT格式
  • metrics.txt:模型评估指标文件,TXT格式,包含精确率、召回率、F1值等
  • training.png:训练过程图片文件,PNG格式
  • confusion_matrix.png:混淆矩阵图片文件,PNG格式
  • 代码文件:
  • code.py:代码文件,Python格式

适用场景

  • IT服务管理研究:分析不同类别工单的分布特征,优化工单分类流程
  • 自然语言处理模型训练:用于文本分类模型的训练与测试,提升工单自动分类准确率
  • 客户服务优化:基于工单分类结果,识别高频问题类型,针对性改进服务
  • 数据脱敏技术研究:探究多步骤脱敏方法在文本数据处理中的应用效果
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.12 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。