一种LabVIEW环境下的语音跟踪系统.doc

上传人:土8路 文档编号:10270372 上传时间:2021-05-04 格式:DOC 页数:7 大小:22.50KB
返回 下载 相关 举报
一种LabVIEW环境下的语音跟踪系统.doc_第1页
第1页 / 共7页
一种LabVIEW环境下的语音跟踪系统.doc_第2页
第2页 / 共7页
一种LabVIEW环境下的语音跟踪系统.doc_第3页
第3页 / 共7页
一种LabVIEW环境下的语音跟踪系统.doc_第4页
第4页 / 共7页
一种LabVIEW环境下的语音跟踪系统.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《一种LabVIEW环境下的语音跟踪系统.doc》由会员分享,可在线阅读,更多相关《一种LabVIEW环境下的语音跟踪系统.doc(7页珍藏版)》请在三一文库上搜索。

1、一种LabVIEW环境下的语音跟踪系统语音技术6晌响0文章编号:10028684(2008)12005404一种LabVIEW环境下的语音跟踪系统肖光华.方勇(上海大学通信与信息工程学院,上海200072)?论文?【摘要】针对室内应用场合,提出了一种基于时延的传声器阵列定位模型.该模型由4个三角阵列组成并根据每个阵列的估计角度按面积逼近方式求得说话人的位置,最后在LabVIEW环境下给出了系统实现方案.实验结果表明,该系统能弥补传统基于时延的定位方法在测距性能上的不足,对说话人进行有效跟踪定位.【关键词】语音跟踪;LabVIEW环境;信号采集【中图分类号】TN912【文献标识码】AASpeec

2、hSourceTrackingSystemBasedOilLabVIEWPlatformXIAOGuanghua,FANGYong(SchoolofCommunicationandInformationEngineering,ShanghaiUniversity,Shanghai200072,China)【Abstract】Alocationmodelofmicrophonearraybasedontimedelayestimationisproposedforsmallsizechambers,whichiscomposedoffourtrianglearrays.Inordertotrac

3、kthespeaker,theanglesestimatedfromeacharrayandareaapproximatingmethodsareimplementedonLabVIEWplatform.Experimentsshowthatthesystemisusefultoovercomethedisadvantageofdistanceprecisionandspeaker-tracking.【Keywords】speechsourcetracking;LabVIEWplatform;signalacquisition1引言语音跟踪技术在视频电话会议,大型会议场所记录,语音识别预处理装

4、置,助听设备等场合具有广泛的应用前景.在声源定位方法中,以基于时延的定位方法运算量小,易于实时实现而得到广泛研究,然而其定位算法在距离估计精度上受环境噪声和混响的影响较大I1l,使得阵列的定位性能大大下降.笔者针对室内应用场合,提出了一种基于时延的传声器阵列定位模型,该模型由4个i角阵列组成并根据每个阵列的估计角度按面积逼近的方式求得说话人的位置,从而避免了单个角阵列在测距性能上的不足,并在LabVIEW环境下提出了整个语音跟踪系统的实现方案.实验结果表明,该系统能对说话人进行有效跟踪定位.2系统定位原理由于说话人在室内垂直方向上的移动距离很小.所以系统只在二维平面上对说话人进行跟踪定位.假设

5、在dmxd111的”会议室内,在其四周分别设置一组角形状的传声器阵列(高度尽量与说话人处于同一水平面),组成一个2D平面阵列,三角阵列的具体放置如图1所示.设说话人位置为(.,Yo),三角传声器阵列位置如A,A2,A,A所示.根据图1所示,假设阵列A的三个传声器坐标分别为(0,0),(,Y1),(,Y:);声源的极坐标形式为(r,);声音速度为c;声源到达3个传声器的时间分别为丁,2,3,它们之间的时间差TOI=r1一r0,o2=r2一r0,则根据声源和传声器阵列A之间的距离关系方程,可求得声【基金项目】国家自然科学基金(60872114);上海市优秀学科带头人项目(05XP14027):高等

6、学校博士学科点专项科研基金(20060280003)国堕室熊生蔓丝鲞蔓塑源相对阵列4的方向角0.,即I.一I=arccos(1)VA+B其中.A-x一(CTO1).一C7”02)(2)B=y2一(c)_yl一(C7”02)(3)D=(c)?一(c)一(c).2+(c)(4)=arctan(B/A)(5)同理,根据声源和传声器阵列的A,A,4之间的相对位置,采用坐标旋转的方式,即可求出02,03,04.理论上,这4条方向直线应交于一点,即(.,Y.),但由于各种误差因素的存在.每2个阵列就会有1个声源位置估计值.为了寻找声源的最优估计,可以采用一种面积逼近的算法,即假设阵列A,A,A估计位置(交

7、点)分别为g:,g,g:,;阵列A,A,A估计位置分别为g.2,g14,g24;阵列A,A估计位置分别为,g24,g其中各位置交点坐标分别为g12:A一2d,暑),fd(1-A3)Aid(1-A3)fdAid1g13:I一J,g14:IA1-A4J,g23:fd(Az-A3+1)a2d/d(A2+1)A2d(A4+1)lA2-A3/:l:/g,A3d,-AA3,A一4Add),Ai为阵列Ai(i=1,2,3,4)方向直线的斜率.它们分别可以构成一个三角形,通过迭代或比较,从中选出面积最小的三角形,则认为它的中心(一般为重心)坐标(互,)就是声源的估计位置.相对于其他平面定位阵列,这种系统阵列布

8、局的优点在于:(1)每个三角阵列所求得的声源目标角度都是解析解.在近场范围内其各个位置的角度误差近似呈均匀分布31.即使某一个阵列受到较大干扰也不会出现较大误差.(2)如图2(a)所示,声源在”阴影”区域内,阵列估计的2组时延正负是保持不变的,其中Q点为传声器.和中垂线的交点.由此可知,在室内如图2(b)阴影”范围内,4组阵列所估计的时延正负都保持不变.从而有效避免了因时延出现正负而产生的误差.降低了时延估计的计算复杂度.虽然其有效跟踪区域比室内面积要小.但由于阵列中传声器的间距相6豌响0=f语音技术对较小,其缩小的面积几乎可以忽略不计.(3)系统只需要知道室内房间的长和宽就可以进行跟踪定位,

9、能适应不同类型的室内场合.(4)安装方便,4组传声器阵列算法和结构完全一样,安装时没有顺序要求,便于维护.3系统设计LabVIEW作为一个优秀的图形化编程平台.它在数据采集,虚拟仪器软件框架,通用接口总线及串口仪器控制,图像处理,运动控制,数据分析和图表显示方面都具有强大的优势,特别是对于一些基于实时数据的采集和分析的应用系统或虚拟仪器的设计.IJabVIEw更是无可替代41.而本系统采用LabVIEW来实现,不仅可缩短设计时间,还可检测系统在实际应用中的性能.3.1语音信号的预处理一般室内环境的噪声比较小,当环境中没有语音信号时,为了防止系统把噪声”误认为”语音信号,需要对信号进行预处理.图

10、3是三角阵列对采集信号预处理的后面板设计流程,其中:(1)先利用采集卡PXI4472将传声器接收到的语音信号按一定的采样率和采样方式进行采集翻,笔者使用的语音信号采样频率为44100Hz,同时采集3个通道的语音信号.(2)将采集到的信号进行分帧,并对每一帧(<0.1S)信号分别进行滤波(3003400Hz的带通滤波),FFTI1变换求功率谱密度,再对每一个频率上的值累加,即得到这一帧信号的能量.(3)根据现场环境设定”噪声门限”,即采集的一帧信号能量低于这一门限的均认为是噪声.门限值可以通过前面板的滑块进行调节.(4)当有足够多帧的连续信号能量超过门限时,存储采集信号用于定位分析,具体帧

11、数可根据现场环境和系统反应速度来决定.这样不仅可避免突发噪声!妻熊塑圭蔓鲞蔓塑国语音技术6响响0(如咳嗽,桌椅挪动等)造成系统的误判,还可防止语音采样信号不充分(采样信号中存在无语音段)而造成的误差.3.2基于时延的三角阵列定位模块设计将储存的采样信号通过时延估计和几何定位.最终得到所需的定位角度.图4为语音定位部分的后面板流程设计,其中:(I)调出采样信号波形,分出每个通道的语音波形送人相应的端口.LabVIEW中波形数据是按矩阵的方式存储的,因此利用索引的方式可以很方便地调出任意一个通道的波形.(2)构建LMS自适应滤波器模块来估计传声器之间的时延并封装成VI的形式方便调用.其中三角阵列定

12、位算法中需要知道2组时延信息,因此设计时要用2个时延模块来估计时延陶.(3)构建几何定位模块并根据时延结果得出声源的位置角度并从串口发出数据.按同样的方式将定位模块封装成VI的形式,留出输入输出端口,使得设计流程更加简洁明了.3.32D平面跟踪系统设计流程根据4个阵列所估计出的角度,就可求出声源在2D平面上的坐标位置.虽然阵列A2,A,A传声器坐标已经改变,但不需要重新列方程求解,由于笔者只需巨堕塞鲢生蔓墼堂蔓塑要求出声源相对阵列的偏角,所以通过变换坐标系就可很方便地求出在4个阵列在各自坐标系的声源角度0,02,03,o4.图5示出系统的整体设计流程,其中:(1)系统初始化.包括室内房间的长和

13、宽,阵列的阵元间距,信号采样频率,采样时间及滤波器设置等.(2)信号采集同步.每个阵列都有各自的信号预处理模块,当跟踪区域内存在语音信号时,由于位置关系并不一定能触发所有的阵列同时进行语音信号采集,所以必须对信号采集作同步处理,即只有在4个阵列都”认为”有稳定语音信号存在的条件下才能同时对语音信号进行采集.这会对说话人的跟踪有一些延迟.但对于室内说话人移动速度和移动范围都不大的情况下,实时跟踪的要求是可以达到的.(3)根据所得到的声源估计位置,采用面积逼近的算法,从而求出声源估计位置(互.).4实验结果为能直观的测试系统定位性能,首先必须给出初始条件.即在安静的环境(噪声在30dB左右)条件下

14、,系统在一个7mx7m的区域内进行测试.三角阵列的阵元间距为1m并且4个阵列中传声器的型号一样.则说话人的活动范围应该在6.5mx6.5m的范围内(由图2可知).由于NIPXI4472采集卡最多只能同时采集8路语音信号,而系统需要能同时采集12路语音信号,所以对每个阵列的信号采集只能分时处理,即在每个位置,说话人至少要进行2次语音信号的采集.其中信号的采样频率为44100Hz,每段语音信号采集的时间为0.5s.图6是说话人部分位置的定位结果,其中说话人的位置坐标是随机的.”表示说话人真实位置,“o”表示声源估计位置.U;一L一口口丑;经过大量测试.系统每个三角阵列的定位精度基本可以在5.范围内

15、.图7为误差范围内估计位置和真实位置距离标准差的仿真结果.从图7中可以看出.结果基本能反映出说话人的真实位置,其误差也在可接受的范围内.当角度误差在5.范围内.其距离误差不超过1.5m,说明系统对于室内噪声和混响的影响具有较强的鲁棒性.而系统跟踪运算时间主要是耗在对信号时延估计的迭代算法上,实验是在PC配置为AMDAthlon(tm)xp1700+1.47GHz,256MB内存的条件下进行的.一组时延估计大约每次在0.3s以内,如果整个系统都由一个处理器来完成运算.则系统给出一次结果大约需要3S,对于室内说话人有限的移动速度和移动范围来说.基本能达到实时跟踪的要求.5结束语笔者针对室内应用场合

16、设计了一套完整的语音跟6嗡0翊=/语音技术踪系统并给出了具体实现方案.实验表明该系统能够满足室内小型会议场合的需要,具有较好的实时性和定位精度.如果每个三角阵列都由独立的处理器来完成运算,终端通过有线或无线的传输方式控制数据的同步接收和发送,系统的实时性能将会有更大的提高.此外,如果能进一步提高阵列定位精度以及降低环境噪声,还可以实现三维空间的语音跟踪定位.参考文献1】ANTONACCIF,LONOCED,MOTYAM,eta1.Efficientsourcelocalizationandtrackinginreverberantenvironmentsusingmicrophonearray

17、sC/Proceedingsof2005IEEEInternationalConferenceonAcoustics,Speech,andSignalProcessing.S.1.:IEEEPress,2005,4:1061-1064.【2梁家惠,王成云,饶宇.声源定位实验一个具有明确应用背景和前沿技术特点的综合性实验J.物理实验,2000,20(1):57.【3】HANGY,BENESTYJ,EIKOGW,PassiveacousticsourcelocalizationforvideocamerasteeringC/Procee-dingsof2005IEEEInternationalCo

18、nferenceonAcoustics,Speech,andSignalProcessing.S.1.:IEEEPress,2000,2:909912.f4周求湛,钱志鸿,刘萍萍,等.虚拟仪器与LabVIEW7Express程序设计【M】.北京:北京航空航天大学出版社,2004.5】罗伟栋,肖光华,方勇.基于LabVIEW的LMS自适应滤波器的设计及其应用J.上海大学学报,2007,13(4):456460.作者简介肖光华,硕士研究生.主要研究方向为传声器阵列的语音定位技术;方勇,教授,博士生导师,主要研究方向为盲信号处理,智能信息系统.【责任编辑】侯莉收稿日期】20080927111妻基圭蔓墼鲞蔓!塑团

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1