本课题的出发点是将系统管理员收集的工作票数据进行管理和统计,然后对这些工作票 数据进行预处理,目的是提取其中有价值的信息,为工作票挖掘提供高质量的数据集。在此 基础上进行挖掘工作,包括故障预测分析等。同时将挖掘结果可视化地展现在系统中,从而 更加清晰地展示发现知识的过程。
1。2 课题研究现状
1。2。1 工作票挖掘的研究
1。2。2 工作票管理系统的现状
1。3 本文主要工作
本文的主要工作如下:
1) 利用数据挖掘相关知识,研究适合于自由文本格式的建模方法来描述工作票,并进行实验 构造具有真实标注(ground truth)的数据集,为下一步对工作票的挖掘打下基础。
2) 研究工作票的挖掘算法中有关工作票预测的方法,实现基于时间序列[17]的分析预测算法。
3) 设计并实现工作票管理和分析系统,利用这个系统对工作票进行统计并将挖掘结果进行 可视化展示。
1。4 本文组织结构
本文总共分为六章: 第一章简述了本课题的背景和研究意义,分别介绍了工作票挖掘和工作票管理系统的研
究现状,阐述了本文的主要工作。 第二章介绍了系统的需求分析,详细介绍了每个功能模块的具体需求。其中包括工作票基
本管理模块、导入导出模块、统计模块和工作票预处理模块、工作票挖掘模块等。 第三章对工作票管理和分析系统进行总体设计,简述了设计目标和基本技术路线,并进行
系统架构设计,描述了系统的整体模块设计和各个功能模块设计。 第四章完成了工作票预处理模块中数据预处理任务,构造 ground truth 的工作票数据集。
根据对原始数据集的分析,提出实验方法并对实验结果进行说明。 第五章实现了工作票挖掘模块中工作票预测的功能点。研究了基于时间序列的预测算法,
运用已有工作票数据预测未来一段时间内工作票数量变化趋势。 第六章实现了该系统,给出系统各个模块运行结果图。对系统进行测试以及可行性改进。
2 系统需求分析
2。1 总体功能需求
工作票管理和分析系统主要由工作票管理和工作票分析两部分组成。工作票的管理功能 主要针对由用户手工填写的工作票数据,可以进行对工作票数据的预处理中数据清理的工作, 如处理空缺值和噪声等过程,具体的预处理方法会在第四章 4。4。1 节描述。能够提供多样化数 据管理的功能,包括可定制查看及排序指定属性字段等。同时还提供数据多字段复杂查询功 能方便系统管理员对工作票进行维护。工作票分析部分的主要工作是将工作票变换成适于挖 掘的形式,在此基础上实现不同的工作票挖掘算法与可视化工作。
系统的管理部分主要包括工作票基本管理模块、导入导出模块和统计模块;分析部分包括 工作票预处理模块和挖掘模块。文献综述
2。2 功能模块需求
2。2。1 工作票基本管理模块
工作票基本管理模块包括工作票属性字段管理、数据维护和数据查看等功能。
1) 工作票属性管理
工作票属性管理主要包括添加属性、修改属性名称等功能。属性字段管理的用例如图 2。1
所示:图 2。1 属性字段管理用例图
2) 数据维护