第六章,对三种机器学习算法进行了测试,综合考虑正确率、召回率以及运行效率,选择了适合的算法,分析了测试中表现出的一些待解决的问题,并提出初步的解决方案。

2 相关介绍与理论概述

2。1 情感分析理论概述

文本情感分析又称之为意见挖掘,是挖掘分析,处理归纳人类主观的带有情感倾向文本的方法,最初情感分析是仅是对不同词语中所蕴含的感情色彩进行分析[2]。比如“舒适”所蕴含的是一种积极正面的情感,而“糟蹋”表达的是一种消极负面的情感,并非所有的词汇都具有情感色彩,大多数名词比如“书本”就不带有感情色彩,同样的词语在不同语境下也可能蕴含截然不同的感情色彩,提炼出文本的情感倾向(正面,负面)是情感分析的最终目的。通常以切割文本的精细程度划分,可以分为词,短语,句,段以及文章级等多个研究层次[3]。不同层次相应地有着不同的难点,词语级面临一词多义、一词多情感等问题。文章级由于篇章较长,并且结构复杂,很难对文章整体的情感进行把控,对语义的分析提出了更高的要求。但从词语级以上的情感分析共性上讲,情感分析主要包含如何抽取有效的情感信息、如何将情感信息正确分类以及如何对情感信息整理与总结这三个层层递进的主要问题,如图2-1。

首先应该把语句中的有效信息提取,根据不同的粒度对输入的文本进行处理,使文本转化为程序易于处理与读取的结构,同时去除对于情感分析意义不大的组成部分,比喻程度副词和状语。然后通过一些算法对处理好的文本结构进行分类,目前通常采用朴素贝叶斯,最大墒等方法进行分类,一般可以分类为正面、反面和中立。也有研究者将文本分类成为更复杂多样的情感如喜、怒、悲、恐、惊。最后对结果进行归纳与总结,将计算的结果整理成已读的结构,一方面作为结果进行输出,另一方面可以加以利用进一步优化程序。来:自[优E尔L论W文W网www.youerw.com +QQ752018766-

2。2 研究现状

3 软件系统设计 

3。1 软件设计流程

软件的目的在于判断给定一段文本所含的情感倾向,对多个机器学习算法进行测试,选择其中性能最好的机器学习算法作为软件最终展示的算法。包含三个主要功能模块,文本预处理、情感分类、输出结果,每个模块单独开发,在每个模块与模块之间设立接口进行测试

上一篇:Red5视频实时采集存储及点播系统设计
下一篇:语音信号的基音周期提取方法研究

基于Apriori算法的电影推荐

PHP+IOS的会议管理系统的设计+ER图

数据挖掘在电子商务中的应用

数据挖掘的主题标绘数据获取技术与实现

基于PageRank算法的网络数据分析

基于神经网络的验证码识别算法

基于网络的通用试题库系...

互联网教育”变革路径研究进展【7972字】

张洁小说《无字》中的女性意识

麦秸秆还田和沼液灌溉对...

我国风险投资的发展现状问题及对策分析

ASP.net+sqlserver企业设备管理系统设计与开发

新課改下小學语文洧效阅...

老年2型糖尿病患者运动疗...

安康汉江网讯

网络语言“XX体”研究

LiMn1-xFexPO4正极材料合成及充放电性能研究