汉语普通话中惊奇和悲伤情感状态的情感特征提取(2)

总结 18

致谢 19

参考文献 20

1 绪论

1.1 研究背景及意义

情感信息处理已成为提高人机交互能力的一个重要研究课题，随着信息技术的高速发展，人类对计算机的依赖性的不断增强。如何实现计算机的拟人化，使其能感知周围的环境和氛围以及说话者的态度和情感等内容，良好地实现人机交互，成为计算机发展的重要目标。

关于情感语音的研究虽然涉及很多方面，但其最终目的无非有两个：其一是让计算机能够合成出更加真实自然的带有情感的语音，即情感语音合成：其二是让计算机能够通过语音信号识别说话者的情感状态，即语音情感识别。

语音情感识别，即通过分析人类语音对应于情感的变化规律，利用计算机从语音中准确提取情感特征，并根据这些特征确定被测对象的情感状态。是目前信号处理及模式识别领域的一个新的研究热点，其主要潜在应用是计算机拟人化，使得使用者在和谐自然的交互模式下高效完成任务，在信息查询系统、计算机辅助教学，电子商务领域，娱乐游戏，虚拟人物对话等领域有着重要意义。

1.2 语音情感发展识别现状[1]

语音情感识别是建立在对语音信号的产生机制深入分析的基础上，对语音中反映个人情感信息的一些特征参数进行提取，并利用这些参数采用相应模式识别方法确定语音情感状态的技术。

语音信号的情感处理涉及到不同语种间的差异，发展也不尽相同。英语、西班牙语、日语和德语的语音情感分析处理有较多的研究，而汉语的情感分析与处理还处于初级阶段。

目前在语音识别研究领域非常活跃的课题为稳健语音识别、说话人自适应技术、大词汇量关键词识别算法、语音识别的可信度评测算法、基于类的语言模型和自适应语言模型，以及深层次的自然语音的理解。研究的方向也越来越侧重于口语对话系统。

1.2.1 情感的定义及分类

什么是情感，这是一个复杂的问题，虽然心理学家对情感的机理进行了大量的研究，但是到目前为止还没有一个情感理论得到广泛的认同。因此对于情感的定义只能在有限的范围内取得一致。大多数场合，不同人之间确实存在着一些确定的、具有一致性的情感表现。

情感的分类，不同学者有不同的分类方法。文献[2]，作者利用四象限来定义情感空间，主要情感分为：愤怒、高兴、悲伤和中性。文献[3]在激活评价空间上对情感进行分析，认为情感分布在一个圆形的结构上，结构的中心是自然原点。通过向四周不同方向扩展，表现为不同的情感。即所谓的“情感轮”方法。文献[4]则提出了分级情感模型。等级越低，分类越粗糙，等级越高，分类越精细。

但过细的情感分类，其情感特征愈加模糊，识别率往往大大降低，因此反而不利于情感识别。所以通常的情感识别中，多采用4-6中情感分类。

1.2.2 声学基础

这里主要给出语音信号几个不常见的特征的定义。

基音：一个复合音是由多个频率不同的纯音组成的，通过一定的方法可以把复合音分解为一定数目的纯音，这些被分解出来的纯音在物理上被称为“分音”。其中，那个振幅最大、频率最低的分音，称为基音。

频谱图：任何一个声音都可以分解为一个或者多个纯音来，这个分解过程就称为频谱分析。将分解出来的每个纯音分频率和振幅两个维度做在一张图上，纵轴表示振幅，横轴表示频率，即得频谱图。

上一篇：基于LabVIEW的火焰光谱分析系统研究

下一篇：基于MATLAB语音信号处理

汉语普通话中惊奇和悲伤情感状态的情感特征提取(2)

基于Kinect的手势识别

基于经验小波变换的汉语...

EEMD复杂环境下汉语的声韵分割算法研究

MPDM复杂环境下汉语普通话双基频检测

PRAAT汉语普通话中高兴和愤...

基于系综经验模式分解（...

基于经验模式分解（EMD）...

网络语言“XX体”研究

老年2型糖尿病患者运动疗...

新課改下小學语文洧效阅...

互联网教育”变革路径研究进展【7972字】

安康汉江网讯

麦秸秆还田和沼液灌溉对...

我国风险投资的发展现状问题及对策分析

ASP.net+sqlserver企业设备管理系统设计与开发

LiMn1-xFexPO4正极材料合成及充放电性能研究

张洁小说《无字》中的女性意识