近年来的一些研究通过编码文本的情感极性来尝试学习弱化的情感词向量。Maas 在他的论文[8]中提出了一个概率主题模型,它可以利用句子中的每个词的词向量推断句子的情感极性。Labutov 和 Lipson使用logistic回归再次嵌入到词嵌入中,它把句子的情感监督作为正则化项。文献综述

2。2  文本情感分析

文本情感分析(也称为意见挖掘)是指用自然语言处理、文本挖掘以及计算机语言学等方法来提取和识别原素材中的主观信息的技术。

2。2。1 文本情感分析的研究领域

情感分析主要分为以下几类:情感极性分析(又称为倾向性分析),情感程度分析和主客观分析等。情感极性分析是指,给出一段文本,分析它的情感是褒义、贬义或者中性,情感程度分析则是在情感极性分析上进行更细的划分。例如,“很棒”和“还好”都是属于褒义情感,但是很明显的是它们的褒义程度是不同的,情感程度分析就需要区分出不同程度的情感。从个人理解来看,情感极性分析就是基于情感的三分类模型,情感程度分析就是基于情感的多分类模型。主客观分析则是指,给出一段文本,判断它是客观的(即不带感情色彩的)还是非客观的。

在文本情感分析领域最早做出贡献的就是Turney[9] 和 Pang[10],他们研究的是商品和电影的评论观点,此研究是基于文档级的两极情感极性分析。再后来,Pang[11]基于早先的两极情感极性分析,对电影评论进行了3至4星多类预测,即情感程度分析。Snyder[12] 还对餐馆的评分进行了更细化的分析,从不同角度如食物,气氛对餐馆进行5星的评级。

2。2。2  文本情感分析的主要方法

目前情感分析的方法主要分为两类:基于词典的方法和基于机器学习的方法。

(1)基于词典的情感分析 

基于词典的方法是指,利用一个情感词典和制定一系列规则,对文本进行段落拆分、句法分析,计算情感值,最后利用情感值来判断文本的情感倾向。

(2)基于机器学习的情感分析 

基于机器学习的情感分析,即是将对情感进行分类。最常见的就是利用机器学习判断情感极性,首先将文本转化为可以作为机器学习输入的格式,然后建立一个分类器,文本的正负向极性作为机器学习中的不同分类,训练出的模型就可以对文本的情感极性做出预测。

(3)基于词典和基于机器学习的情感分析比较

和基于词典的情感分析相比,基于机器学习的情感分析的特点是,它并不关心文本中具体包含哪些情感词,而是依赖于预料标注的类别是否准确。模型结果的好坏与语料库的规模和语料库的标注准确率有直接关系。

2。3  深度学习

深度学习是机器学习领域的一个方向,深度学习的概念最早由多伦多大学的Geoffrey Hinton 等人于2006年提出[13]。它其实是对多层人工神经网络的训练过程进行了改进,人工神经网络的出现最早可以追溯到1958年Rosenblatt提出的可以模拟人类感知能力的数学模型:感知器,因其结构过于简单且不能解决线性不可分问题,人工神经网络的发展长年处于低潮,直到1980年后反向传播算法被引入多层感知器,人工神经网络又开始成为研究热点,但是因为计算机计算能力的不足和训练数据的规模较小以及支持向量机等算法的兴起,导致人工神经网络自从2000年后再次陷入低潮,直到2006年Geoffrey等人对训练算法的改进,并提出深度学习的概念,从此,深度学习便火的一发不可收拾,目前,深度学习在语音识别与合成、机器翻译、大规模图像数据集、视频分类及行为识别等领域得到了广泛的应用。来:自[优.尔]论,文-网www.youerw.com +QQ752018766-

上一篇:Delphi校园学生公寓楼门禁管理系统设计+ER图
下一篇:Postgres-xc亚信分布式数据库自动化部署工具的设计与实现

基于Apriori算法的电影推荐

基于PageRank算法的网络数据分析

基于神经网络的验证码识别算法

基于网络的通用试题库系...

python基于决策树算法的球赛预测

基于消费者个性特征的化...

基于网络的通用试题库系统的整体规划与设计

我国风险投资的发展现状问题及对策分析

互联网教育”变革路径研究进展【7972字】

麦秸秆还田和沼液灌溉对...

LiMn1-xFexPO4正极材料合成及充放电性能研究

张洁小说《无字》中的女性意识

网络语言“XX体”研究

ASP.net+sqlserver企业设备管理系统设计与开发

老年2型糖尿病患者运动疗...

新課改下小學语文洧效阅...

安康汉江网讯