2。3 双耳信号采集 10
2。3。1 与头相关传递函数 11
2。3。2 双耳信号的计算机模拟 11
2。3。3 双耳信号的人工头采集 12
2。4 本章小结 14
3 神经网络原理与算法简介 15
3。1 神经网络模型简介 15
3。1。1 神经网络的研究背景 15
3。1。2 神经网络的优点 16
3。2 神经网络的构成 16
3。2。1 神经元 16
3。2。2 神经网络拓扑结构 17
3。2。3 神经网络学习算法 18
3。3 BP神经网络 19
3。3。1 BP网络模型 19
3。3。2 BP算法学习过程 20
3。4 本章小结 21
4 基于神经网络的声源定位算法 23
4。1 神经网络声源定位算法流程 23
4。2 双耳定位线索提取 23
4。2。1 预处理 23
4。2。2 双耳特征提取 25
4。3 网络训练与测试 27
4。4 定位效果的评估 28
4。5 本章小结 30
结 论 31
致 谢 33
参考文献 35
1 绪论
1。1 声源定位的研究背景及意义
香农(Shannon)于1948年发表的《通信的数字理论》标志着信息论的正式诞生以及为数字通信时代的到来提供了理论基础。随着数字通信技术、数字信号处理(DSP)技术与计算机技术的不断完善,语音信号处理(Speech Signal Processing, SSP)技术,作为现代通信领域的重要环节以及语音处理范畴的一个重要的学科分支,具体包含语音的合成(Synthesis)、编码(Coding)、识别(Recognition)与增强(Enhancement)等主要分支。特别是在2015年提出的“互联网+”创新浪潮驱动下,即时通信需求激增,各类即时通信App均相继推出语音甚至视频交流,大大促进了语音处理的发展进程。由此可见,语音处理技术必然是当今乃至未来发展中必不可少的重要方向。
语音是人类沟通交流的最主要的一种方式,也是我们日常获取信息的最主要来源之一。随着科学技术的与时俱进与人类科学水平的不断提高,利用现代化技术对语音进行处理,可使人能够更加快捷有效地获取到语音中的信息。声源的位置信息作为语音信息中重要的一环,能够帮助听众更好地确定说话人的方向、距离的远近。在视频会议中话音的识别技术以及助听装置等方面、盲人行走以及机器人夜间追踪等过程中均可以从声源位置信息中受益颇多。由于外界环境的影响使得实际情况下的语音信号毫无疑问均存在噪声,这时候机器便可派上用场,可代替人耳对语音进行处理,帮助人们更好地判断声音位置,这便是声源定位技术。