3。5 数据库设计 24
3。6 本章小结 27
4 工作票预处理 28
4。1 数据预处理基础 28
4。2 任务需求及目标 29
4。3 原始数据集描述 29
4。4 提出实验方法 31
4。5 实验过程及结果 35
4。6 实验总结 38
4。7 本章小结 39
5 工作票挖掘实验 40
5。1 工作票预测需求分析 40
5。2 基于时间序列的预测算法 40
5。3 本章小结 41
6 系统实现与测试 42
6。1 开发及运行环境 42
6。2 功能模块实现 42
6。3 系统运行与测试 53
第 II 页 本科毕业设计说明书
6。4 本章小结 54
结 论 55
致 谢 56
参 考 文 献 57
1 绪论
1。1 选题意义与背景
在现代信息技术的快速发展下,各个领域对于 IT 业务的依赖日益提高。随着应用领域不 断扩大,IT 系统的复杂性逐渐提高,现代计算机系统的监控和维护变得十分复杂。这些计算 机系统由 IT 服务提供商和维修人员共同管理,他们需要对系统中产生的问题报告进行分析并 采取有效方案及时解决。这些问题报告来源于系统的用户,他们会以 ticket 的形式记录下问 题细节,包括系统使用中出现的故障、错误或者任何有关系统问题的描述。本文将这些记录 问题的 ticket 称为“工作票”。对于维护大中型软硬件系统来说,工作票中包含着十分有价值 的信息。
系统的维护工作使得公司难以集中精力在其核心业务上。据估计,对于大中型公司来说, 有 30% 到 70% 的信息技术资源都用来作为维护成本[1] 。 基于自动化计算[1]( Automatic Computing)的 IT 系统维护服务不仅能够确保系统安全可靠运行,切实提高生产效率和服务 质量,还使得 IT 系统能够更好地服务于生产运营和管理。对工作票中描述信息的挖掘是实现 Automatic Computing 的基础和关键。通过实现对这些维修请求自动分类并且准确预测故障信 息,能够大大提高系统的可用性,从而降低系统维护成本,减少因系统故障而带来的不可挽 回的损失。然而,系统的复杂性也决定了工作票的多源性和多样性,采集方式不同及自由文 本形式都给研究带来了极大的困难。论文网