情绪分类的主要研究方向有两个,分别为构建情绪资源和使用监督学习方法。情绪资源构 建又分为情绪词词典构建和句子级或文档级的语料构建。情绪词词典构建,例如,Xu 等通过 计算种子词与现有的同义词词典、语义词典以及语料的相似矩阵,使用基于图的规则方法构 建情绪词典【1】。语料构建,比如采用网络博客文章作为初始文本语料,人工标示这些中文文 本中与情感相关的语言信息而构建的 Ren_CECps 1。0。使用监督学习方法,例如,Purver 等将 每一条微博中的表情符或#标签对应的情绪类别作为该条微博的情绪类别标签,再用去除表情 符和#标签后剩下的词代替该条微博,用这样的方法构成最终语料,再通过 SVM 的方法实现的 情绪分类【2】。
根据阅读的文献,我总结出以下三种常见的情绪分类:(1)Ekman 将情绪分为六种:喜
(joy),哀(sadness),怒(anger),惧(fear),恶(disgust),惊(surprise)【2~4】。(2)大连理 工情感词汇本体在 Ekman 的基础上,将情绪类别进一步细致分类,最终将情绪分为七种:高兴
(happiness),喜好(like),悲伤(sadness),愤怒(anger),恐惧(fear),厌恶(disgust),惊讶(surprise)【5~7】。 (3)Ren_CECps 1。0 采用网络博客文章作为初始文本语料,人工标记八种 情绪:期待(expect)、高兴(Joy)、喜爱(Love)、惊讶(Surprise)、焦虑(Anxiety)、悲伤(Sorrow)、 生气(Anger)和憎恨(Hate)[8~11]。
目前,情绪分析的两种主流方法为基于规则的无监督方法和基于机器学习的监督方法。 基于规则的方法主要受情绪词典和规则的影响,其中情绪词典的影响更大。它通过统计文本中 属于同一类别的情感词,计算出整个文本的情绪。监督机器学习方法有朴素贝叶斯(Naive Bayesian,NB)、支持向量机(Support Vector Machine,SVM)、K 最近邻(k-NearestNeighbor , KNN)等。这种方法在文本情感分析中获得的准确度较好,但是它需要在已知类别的训练样本 集合上学习,而标注工作需要大量的时间以及有经验的专门人员。74312
参 考 文 献
[1] Xu G, Meng X, Wang H。 Build Chinese emotion lexicons using a graph-based algorithm and multiple resources[C]//Proceedings of the 23rd International Conference on Computational Linguistics。 Association for Computational Linguistics, 2010: 1209-1217。
[2] Purver M, Battersby S。 Experimenting with distant supervision for emotion classification[C]//Proceedings of the 13th Conference of the European Chapter of the Association for Computational Linguistics。 Association for Computational Linguistics, 2012: 482-491。论文网
[3] Ekman P。 Facial expression and emotion[J]。 American psychologist, 1993, 48(4): 384。
[4] Esmin A A A, de Oliveira R L, Matwin S。 Hierarchical classification approach to emotion recognition in twitter[C]//Machine Learning and Applications (ICMLA), 2012 11th International Conference on。 IEEE, 2012, 2: 381-385。
[5] 徐琳宏, 林鸿飞, 潘宇, 等。 情感词汇本体的构造[J]。 情报学报, 2008, 27(2): 180-185。]
[6] 欧阳纯萍, 阳小华, 雷龙艳, 等。 多策略中文微博细粒度情绪分析研究[J]。 北京大学 学报 (自然科学版), 2014, 1: 010。
[7] Wen S, Wan X。 Emotion classification in microblog texts using class sequential rules[C]//Twenty-Eighth AAAI Conference on Artificial Intelligence。 2014。
[8] Quan C, Ren F。 Construction of a blog emotion corpus for Chinese emotional expression analysis[C]//Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing: Volume 3-Volume 3。 Association for Computational Linguistics, 2009: 1446-1454。
[9] Xu J, Xu R, Lu Q, et al。 Coarse-to-fine sentence-level emotion classification based on the intra-sentence features and sentential context[C]//Proceedings of the 21st ACM international conference on Information and knowledge management。 ACM, 2012: 2455-2458