毕业论文中文摘要本文针对电力设备断路器故障文本特征信息提取的问题,着重考察了电力设备断路器发生故障的情形,利用断路器故障后产生的文本,开发了一种基于文本挖掘技术提取电力设备断路器故障特征信息的方法。具体地,采用向量空间模型方法将电网企业信息系统中半结构化的断路器信息转化为计算机可识别的结构化信息,对文本进行分词、标准化、聚类等步骤,建立立断路器故障表征信息与部件之间、以及部件与部件之间的关联关系。最终以结构图形式实现断路器故障特征信息的计算机可视化表达。并且,以一个来自云南电网公司断路器故障文本的算例具体展示了该方法的有效性和实用性。算例表明,本方法可抽取断路器故障数据中的有价值信息并发现知识规律,实现发现和提取导致故障发生的深层原因之目的。80149
毕业论文关键词 断路器 聚类分析 文本挖掘 数据挖掘
毕业论文外文摘要
Title A Research on Information Extraction Method for Text Features of Circuit Breaker Failure
Abstract When considering the problem of the information extraction for text features of circuit breaker,it has always been a headache for the engineers and scholars。Based on the technique of text mining and information extraction,this passage develops a new method for information extraction of text features of circuit breaker failure。Vector Space Model(VSM)is used when transforming the semi-structural information which has been recorded in the information managing system of grid enterprise to structural information that can be identified by computer。Then word segmentation,normalizing,clustering analysis is used to identify the relativeness between the failure information and electrical components。A visual representation of information extraction is set up in the form of assumption diagram。In addition,a numerical example from Yunnai Grid Corporation is used to prove the effectiveness of the proposed method。
Keywords Circuit Breaker clustering analysis Text Mining Data Ming
目 次
1 引言 1
1。1 研究背景 1
1。2 研究现状分析 1
1。3 研究内容框架 3
1。4 研究方法 5
2 断路器故障文本特征信息提取方法 6
2。1 断路器故障文本信息特点 6
2。2 断路器故障文本特征信息抽取算法的提出 6
2。3 小结 10
3 文本挖掘算法的算例分析 11
3。2 断路器故障特征信息可视化 15
3。3 断路器故障文本挖掘算法的R语言实现 16
3。4 小结 17
结 论 17
4。1 总结 18
4。2 展望 18
致 谢 19
参 考 文 献 20
1 引言
1。1 研究背景
随着计算机技术地不断进步,信息时代已经来临,企业信息化持续提高,其中电力企业也不能忽视企业信息化的重要性。确保电力设备的稳定运转是保障企业生产秩序最重要的前提,如果电力设备频繁出现故障,企业正常的生产活动、生产效率一定受到严重影响。在电力系统中,断路器起着控制和保护的用,是最重要的开关设备,它对电力系统的正常运行有着很重要的影响。因此,确保电力设备稳定运转的关键在于断路器平稳、可靠地运行。本文针对电力设备断路器故障文本特征信息提取的问题,着重考察了电力设备断路器发生故障的情形,利用断路器故障后产生的文本,开发了一种基于文本挖掘技术提取电力设备断路器故障特征信息的方法。论文网