相关情感术语介绍情感(emotion)是态度中的一部分,《心理学辞典》中提到:“情感是人对客观事物是否满足自己的需要而产生的态度体验”。在普通心理学课程中认为:“情绪和情感都是对客观事物所持的态度体验,只是情绪更倾向于个体基本需求欲望上的态度体验,而情感则更倾向于社会需求欲望上的态度体验”。人们看到网上的新闻时,都会发表各自的看法和评论,这些看法和评论都会带有情感色彩。78671
情感词就是指带有感情色彩的词语,判断文本内容的情感倾向就是通过情感词来表达的。一般可以将情感词分为积极方面的情感词和消极方面的情感词,比如表达积极的词有开心、勇敢、精彩、灿烂、温柔,表达消极的词有愤怒、痛苦、恐惧、悲伤等。
情感词典是由积极和消极两方面的词语构成的。也可以说是由褒义词典和贬义词典两部分组成。
情感倾向就是指人们对存在的某一件事进行的评价和判断。衡量它的两个标准是:情感词是积极的还是消极的。不同的情感词表达的情感倾向的程度也是不相同的。
在自然语言处理领域,文本情感分析又称为倾向性分析、观点提取、主观分析等。简单点说就是对带有情感色彩的主观性越来越强的文本进行分析、处理等过程。随着网络的不断发展,越来越多的用户参与到网络中来分享自己的个人感受和看法等。主要包含喜、怒,哀、乐等情感。如今,文本情感分析已经成为自然语言处理研究领域的热点之一。
(1)利用机器学习方法分析文本情感论文网
机器学习模型包括:朴素贝叶斯(Naive Bayes),中心向量分类法,最大熵(Maximum Entropy),支持向量机(SVM)。国外,Pang Bo等人[1-2]利用朴素贝叶斯、最大熵、SVM等算法对电影的评论进行分类,其实验结果显示,SVM是最好的分类效果。
中文情感分析方面,潘宇等人[3]以句子为单位将复杂特征句划分成简单特征句,分析句子的语义倾向性。徐军等人[4]利用朴素贝叶斯算法和最大熵算法对新闻文本情感进行分类研究,判断其是正面还是负面的。唐惠丰等人[5]通过研究中心向量法、Naive Bayes、KNN和SVM等算法分别在不同类别的文本中情感分析研究的重要性。
(2)利用情感词典分析文本情感
国外研究起步于1990年底,文献[6]通过使用点互信息(PMI)来扩展积极和消极词语,用极性语义算法分析文本情感。文献[7]对有关政治人物的新闻报道情感倾向进行分析研究,通过极性元素分布、极性元素密度和语义强度统计文本的情感倾向。实验证明了该方法的有效性。
国内相对于国外在对文本情感分析研究方面起步较晚。文献[8]利用关键词模板测试文本的情感倾向。文献[9]从词汇和句子结构方面入手,采用手工标注和自动添加相结合的方法,构成了情感词汇库对文本进行情感分析研究。文献[10]利用中文词典HowNet判断词语的情感倾向,实验结果表明达到了较高的准确率。
1 有关情感倾向分析的词典资源
下面介绍前人总结出来的情感词词典资源:
(1)、NTUSD词典是由台湾大学收集的,有两个版本,分别是简体中文和繁体中文。该词典包含8276个消极情感词和2812个积极情感词。
(2)、HowNet词典的定义是指以中文和英文为描述对象。该词典一共有18335个词语,其中9193个中文词语和9142个英文词语。