随着各类电子设备产品的技术不断提高,已经越来越趋于智能化。而语音通讯范围有两种不可缺少的技术,一是对语音的增强,二是对声源的定位。在声源定位技术中,使用最普遍的就是基于麦克风阵列的方法。系统采用麦克风阵列[1]采集声源信号的信息,然后对其进行模数转换,通过一系列定位计算就能获得声源所在地的坐标信息。目前,基于麦克风阵列应用[2]的声源定位技术有很多:(1)人机交互:目前,机器人技术不断完善,已能做一些简单的工作。所以,许多人希望智能化机器人能够帮人类完成一些日常事务,比如照顾老年人和残疾人的生活,解除他们的烦闷这些事。然而,人们应该怎么去命令机器人去做这些事情呢?最简单的无外乎就是直接和机器人“说话”。当人们说话时,机器人能够自动识别,并判定声源的位置,从而提供服务。要达到这种级别,便得对机器人的听觉系统[3]做一番功夫,其中要用到的核心技术便是声源实时定位技术[4]和语音识别技术[5];(2)军事领域 :在战争时,声源定位技术在反偷袭方面应用的比较多,不仅可以用来探测敌方迫击炮发射的方位,而且对反狙击也能有较高的精度,从而减少伤亡。(3)视频、电话会议系统 :目前许多视频会议系统采用了这种技术,使用声源定位技术不但能迅速找到当前说话的人的位置,并且系统可以主动的将麦克风对准说话的人的方位,过滤掉其他地方的噪声,这大大提高了视频会议系统的真实性,给人以舒适的感觉;(4)助听器 :基于麦克风阵列的助听器能够凭借声源的位置,自动的对齐声源的方位,不但可以降低环境中的噪音,同时也优化了助听器的性能;(5)智能手机去噪:现在,许多智能手机都开始采取麦克风阵列技术来降低噪声,通过麦克风阵列对信号进行处理,降低环境噪声,对说话人的声音进行语言加强。
1。2 课题目的及意义
在20世纪后期,便有许多应用于研究语音信号处理的事例,都是基于麦克风阵列的,到了20世纪末,一个新的研究热门是基于麦克风阵列的语音信号处理算法。
声源定位技术的研究涉及到了多个领域范畴,包括模式辨认、信号处理、数模转换、神经网络学等多个方面。因此,要想对其有个深入研究,就得学习一些或复杂或简单的知识。当然,与付出相对应的,收获也是非常大的。声源定位技术前景非常普遍,这在上一章中已有简单介绍。比如,在现有的银行监控系统或者是博物馆监控系统中,采用声源定位的技术可以使摄像头、红外线指向声源处,这大大提高了安保的安全性,有效的提高了监控效率。还有网络会议,电视电话会议和多媒体教室等领域也会用到声源定位技术,这会使摄像头指向说话人,大大提高了虚拟会议的真实性,方便了人们之间的交流。
声音不仅能给人们以便利,而且能充实人们的娱乐方式,而用声源定位技术能给人们充分利用声音,这能很好的为人们提过有效的帮助。声源定位技术有很多前景无限的研究方向,这已经有许多事例可以证实。目前,声源定位技术的发展还在不断进行中,其应用范围也越来越广,规模越来越大,越发贴近于人们的平常生活[6]。
1。3 课题技术现状
1。4 本文主要工作及论文结构
本文主要介绍的是基于jetson-tk1嵌入式终端的声源定位的后端系统设计与开发。后端系统主要做三个模块:声音的采集与预处理模块,时延估计模块以及定位模块的设计与实现。
本文共有5章,章节安排如下:文献综述
第一章是绪论,简单讲了声源定位课题的背景、目的和意义,还有课题技术在国内和国外的研究现状与应用。