摘要系统日志中记录着大量系统活动、状态信息,这些信息用途很多,例如:操作分析、异常检测、软件调试、性能检测等,但是由于其格式不固定、信息混杂、数据量大等特点,人工分析效率低。基于这个原因,本文设计并实现了一个Java Web应用——日志管理与分析系统,该系统提供日志管理、事件抽象、模式挖掘等功能,旨在充分挖掘日志中包含的珍贵信息。系统对日志数据进行文本聚类和数据挖掘,然后将聚类结果和关系模式以图表的形式展现。文本聚类采用的基于K-means的logSig算法,并且结合Gaussian分布对其进行了算法改进。日志分析和模式挖掘采用的主要算法是基于Apriori的时序模式挖掘算法。82699
毕业论文关键词 日志管理 聚类算法 模式挖掘
毕业设计说明书外文摘要
Title Design and implementation of log management and analysis system
Abstract Extensive information of system activity and state recorded in the system log is useful in many ways, such as the analysis of operation, the detection of exception, the debugging of software and performance testing。 But owing to the unfixed format, mixed messages, the huge amount of data, analysis manually is inefficient。 Based on this reason, we designed and realized a Java Web application, the log management and analysis system in this paper。 The system provides log management, event abstraction, pattern mining and other functions, to excavate valuable information contained in the log。 After text clustering and data mining, the results of text clustering and patterns are displayed in the form of charts。 The text clustering uses the logSig algorithm based on K-means algorithm and improved with Gaussian distribution。 Log analysis and pattern mining use the sequential pattern mining algorithm based on the Apriori algorithm。
Keywords Log management Clustering algorithm Pattern mining
目 次
1 绪论 1
1。1 选题意义与背景 1
1。3 本文主要工作 3
1。4 本文组织结构 3
2 系统需求分析 4
2。1 日志示例 4
2。1。1 系统操作记录日志 4
2。1。2 大型软件开发环境MyEclipse系统日志 4
2。1。3 应用类软件调试日志 6
2。2 需求概述 6
2。2。1 功能需求 6
2。2。2 性能需求 6
2。2。3 运行平台 7
2。3 需求建模 7
2。3。1 用例图 7
2。3。2 流程图 8
2。4 本章小结 9
3。1 设计目标 11
3。2 基本技术方案 11
3。2。1 J2EE构架 11
3。2。2 Structs 2构架 11
3。2。3 HTML 5 + CSS 3 + Jquery 1。6。4前端交互