毕业设计(论文)-基于S3C2410声音频谱分析系统设计.doc

上传人:来看看 文档编号:3283463 上传时间:2019-08-08 格式:DOC 页数:38 大小:599.02KB
返回 下载 相关 举报
毕业设计(论文)-基于S3C2410声音频谱分析系统设计.doc_第1页
第1页 / 共38页
毕业设计(论文)-基于S3C2410声音频谱分析系统设计.doc_第2页
第2页 / 共38页
毕业设计(论文)-基于S3C2410声音频谱分析系统设计.doc_第3页
第3页 / 共38页
毕业设计(论文)-基于S3C2410声音频谱分析系统设计.doc_第4页
第4页 / 共38页
毕业设计(论文)-基于S3C2410声音频谱分析系统设计.doc_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《毕业设计(论文)-基于S3C2410声音频谱分析系统设计.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)-基于S3C2410声音频谱分析系统设计.doc(38页珍藏版)》请在三一文库上搜索。

1、北华大学毕业设计(论文)摘要频谱分析是将信号表示成不同频率的正弦分量或虚指数分量的叠加,即从频率的角度分析信号,它在声音处理、图像处理、数字音频、地震勘探等方面有着广泛的应用。快速傅立叶(FFT)算法和S3C2410芯片的出现,为频域分析的实时处理提供了有效的解决方案。本文对基于S3C2410的声音信号频谱分析系统进行了开发,主要工作如下:首先,对声音信号的时域和频域处理方法进行了分析,根据声音信号短时平稳的特点,详细阐述了其短时分析方法,并探讨了声音信号的基音周期检测方法。然后,详细介绍了本系统采用的主要硬件设备的功能和特点,包括S3C2410芯片。在此基础上,完成了系统的硬件和软件设计,给

2、出了核心程序实现过程及部分原代码,实现了一种基于S3C2410的声音频谱分析系统。该系统结构简单、使用方便,可利用ARM9强大的数据处理功能对声音信号进行频谱分析。最后,对此设计方案进行了理论分析和仿真实验,并在S3C2410上就一些相关问题做了实验,取得较为满意的结果,验证了该系统的可行性。关键词:声音频谱分析;声音处理;快速傅立叶变换;S3C2410AbstractSignal is regarded as superposition of different frequency sine component or virtual function component in spectru

3、m analysisSpectrum analysis is applied extensively in the speech processing,image processing,digital audio,seismic exploration etcSince fast Fourier transform(FFT)and S3C2410chip appeared,it provides effective solutions for real-timeprocessing of spectrum analysisThis thesis developed spectrum analy

4、sis system based on speechS3C2410Major works areas follows:First,the timedomain processing and frequency-domain processing of speech signal are introduced in this thesisAccording to shortterm stationary characteristics of speech signal,the thesis exposition shortterm analysis method in detailAnd als

5、o discuss the pitch detectionmethod based on speech signalSecondthe functions and features of main hardware equipments are introducedThis system include S3C2410 .The systems hardware and software design are completed and part of source code about core procedure are providedWe developed the spectrum

6、analysis system of speech signal based on S3C2410The system has a simple structure and is easy to usewhile we use the powerful processing function of S3C2410 to analyze speech signalFinally,the total scheme of this system is demonstrated in theory and is tested on the S3C2410,and results is satisfac

7、toryAnalysis results prove that the system is feasibleKey Words:Spectrum Analysis;Speech Processing;FFT;S3C2410目录摘要1Abstract2引言51 绪论61.1 课题研究的背景和意义61.2频谱分析系统的发展现状71.3本课题的主要任务82 声音信号的时域分析92.1 声音信号的抽样及其数字化92.2声音信号的时间依赖102.3 短时自相关函数112.3.1 自相关函数的定义和性质112.3.2短时自相关函数122.4基音周期估计方法122.4.1 基音检测预处理132.4.2自相关

8、法基音检测算法132.4.3基音检测的后处理143 声音信号频域分析153.1 频谱分析原理与方法153.1.1频谱分析原理153.1.2频谱分析方法173.2傅里叶变换的原理及算法183.2.1 傅立叶变换的基本定义183.2.2离散傅立叶变换193.2.3快速傅立叶变换203.3短时傅立叶变换213.4基于短时傅立叶变换的语谱图223.5基音同步分析方法233.5.1 短时频谱用于基音检测233.5.2基音同步频谱分析244 S3C2410微处理器简介264.1概述264.2S3C2410芯片功能及内部结构264.2.1S3C2410芯片功能单元264.2.2S3C2410系统管理274.

9、3ADC和触摸屏接口操作274.3.1 结构图274.3.2 触摸屏接口举例284.4 功能描述294.4.1 A/D 转换时间294.4.2 触摸屏接口工作模式295频谱分析系统设计与实现315.1声音采集软硬件设计方案315.1.1声音采集硬件系统设计方案315.1.2声音采集软件系统设计325.2基于S3C2410声音频谱分析系统的软件设计325.2.1基于S3C2410处理器器的LCD显示原理325.2.2ADC驱动程序设计345.2.3FFT的程序设计355.3运行效率分析36结论37参考文献38致谢39引言目前,嵌入式技术已经广泛深入的融入到了各行各业当中,日常生活的各个角落都可以

10、看到嵌入式技术的身影。相对于通用PC,嵌入式系统是专门针对某一特定领域进行优化设计的系统,具有软硬件可裁剪,成本低,体积小,功耗低,可靠性高等特点。手机,PDA,传真机,打印机,自动贩卖机等都是典型的嵌入式系统。这里,简单介绍一些嵌入式系统的定义。广义来说,凡是不用于通用目的的可编程计算机设备,就可以算是嵌入式计算机系统。狭义而言,嵌入式系统是指以应用为核心,以计算机技术为基础,软硬件可裁剪,适于应用系统对功能、可靠性、成本、体积和功耗要求严格的专用计算机系统。嵌入式系统的核心部件是嵌入式处理器,嵌入式处理器目前主要有ARM,Aml86/88,386EX,SC一400,Power PC,680

11、00,MIPS系列等。对于开发者而言,可以根据各自的实际需求选择不同的嵌入式处理器。将嵌入式技术与频谱分析相结合,其功能将更加强大。其中ARM处理器核中自带了DSP功能,既可以执行算法还可以进行事务处理,并且支持广泛的操作系统,适应于未来智能化发展方向。结合ARM技术的信号频谱分析模块,集运算,显示,良好的用户界面为一体,将拥有广阔的应用前景。1 绪论1.1 课题研究的背景和意义自然界的运动和变化都有它们的固有规律,其中很多规律表现为周期性。大至宇宙天体,小至基本粒子,它们的运动都有周期性。人类社会的发展也有周期性,这就是为什么很多历史事件具有惊人的相似性。不管是简单的重复,还是螺旋式的上升,

12、都是周期性的表现。人耳对声音敏感的不是声波本身而是声波的频率,例如男声、女生和低音、高音;人眼对光敏感的不是光波本身,而是光波的频率(颜色),例如红光、绿光。所以,频率的概念和时间的概念一样重要。这就是为什么人们把频域和时域相提并论。频谱分析在生产实践和科学研究中有着广泛的应用。例如,对各类旋转机械、电机、机床等机器的主体或部件进行实际运行状态下的谱分析,可以提供设计数据和检验设计结果,或者诊断故障,保证设备的安全运行等。在声纳系统中,为了寻找海洋水面船只或潜艇,需要对噪声信号进行频谱分析,以提供有用信息,判断舰艇运行速度、方向、位置、大小等。因此,对频谱分析方法的研究一直是信号处理技术中的一

13、个重要课题。所谓频谱分析就是频域分析,频谱估计就是周期性估计。频谱分析和估计不仅是揭示信号特征的重要方法,也是处理信号的重要手段。这些方法和手段已经广泛地应用于通信、雷达、地震、声纳、生物医学、物理、化学、音乐、经济等领域。地震信号的处理和股票市场的预测就是其中两个例子。如此广泛的应用主要归功于声音处理理论和技术的进步,因为快速傅立叶变换FFT算法和S3C2410芯片的出现,为各式各样的频域问题,提供了一个统一的、经济的、单片继承的解决办法。频谱分析仪,顾名思义它的功能是确定一个变化过程(称为信号)的频率成份,以及各频率成份之间的相对强弱关系。频谱仪是和示波器相对偶的,它们具有同样的重要性。示

14、波器在时域里显示或表征(输入)信号,而频谱仪在频域里显示或表征(输入)信号。传统的频谱分析仪主要依靠硬件来测量频率成份,例如用滤波器来分开各频率成份。对模拟滤波器设计制造有经验的人,不难想象制造高稳定度、高精度的这种频谱分析仪的困难程度。首先是设计所得的元件值,几乎全是非标准的。而且必须先经过“老化”。其次是滤波器中心频率会随时间、环境温度“漂移”,还有调试等问题。利用S3C2410芯片来设计频谱分析系统则可以较好解决这些问题。因为频谱分析主要是依靠软件来计算频率成份。1.2频谱分析系统的发展现状频谱分析仪是以模拟或数字方式显示信号频谱的一类信号分析仪。频谱分析仪大体可分为扫描调谐式频谱仪及傅

15、立叶分析仪两大类。扫描调谐式频谱仪如扫频超外差接收机,能分别显示复杂信号中各个不同频率分量的幅度,但不能提供相关相位信息。这类仪器主要用于连续信号和周期信号的频谱分析。其优点是具有大的动态范围及宽的频率范围(5Hz325kHz),但不适合做瞬态信号及超低频信号的分析。傅立叶分析仪采用数字采样及数学变换(以傅立叶变换为基础)技术得到被测信号的傅立叶频谱。采用傅立叶分析仪能在被测信号存在的有限时间内,提取信号的全部频谱信息,并能显示频率、幅值及相位。傅立叶分析仪基本上用于低频信号(10uHzl00kHz)的分析以及要求实时快速测量的场合。与前一类频谱仪相比,傅立叶分析仪可以十倍、百倍地提高测量速度

16、并能在超低频时保持频率测量精度。由于采用傅立叶分析仪能同时测量每个频率分量的幅值和相位,适合于分析暂态过程,测量多个信号的统计特性,评价两个或多个信号之间的连接特性及相关性等。扫描调谐式频谱分析仪己从早期的单通道频率响应分析仪扩展到多通道,其典型代表是英国公司的1250频响分析仪,它配上相应的扩展器可扩展到36通道。天津电子仪器厂生产的TDl250具有类似的性能。与傅立叶(FFT)频谱分析仪相比,这类频响分析仪只局限于频响分析,应用范围较窄,其优点是具有自动抑制噪声能力,而且频率范围宽。目前生产傅立叶分析仪的国家较多,从占领世界市场的情况看,美国居首位,其次为同、法、英、丹麦、中国等。我国先后

17、引进的这类产品HP3562A,HP35660A,HP3567A,CF.920,CF.930/940,B&K2034,SOLARTRONl220等几十种。具有代表性的是HP3567A多通道频谱/网络分析仪,频率范围可达102.4kHz,动态范围80dB,精度0.1 dB,最高通道数可达16,可实现谱分析、波形分析及网络分析。1965年库利一图基在计算数学杂志上发表了快速傅立叶变换(FFT)算法,FFT和频谱分析很快发展成为机械设备故障诊断、震动分析、无线电通信、信息图像处理和自动控制等多种学科重要的理论基础。傅立叶分析仪的发展趋势是:分析频段向高频扩展,向多通道、高指标、多功能发展,核心处理芯片

18、用S3C2410,体积更趋小型化。国内自80年代初就有不少单位开始了基于FFT的频谱分析仪的研制,但由于国内在基本元器件、基本配套件和基本工艺三方面落后于发达国家,因而多数走的是“以软件代替硬件”的道路,即以IBM PC/AT等微机为核心,配上A/D转换板及S3C2410芯片,以微机软件为主实现各种数字信号处理功能及显示功能。因而,具有研制周期短、灵活性好、价格低的优点;缺点是高速实时性能较差,不适用于恶劣环境。国内不少单位己生产出不同性能的动态信号分析系统、FFT信号分析仪等,在开发性能优越的动态信号分析软件包方面,国内一些高等院校具有一定优势。虽然使用FFT技术对瞬态过程和平稳过程的频谱分

19、析己有很长的历史,但是,声音过程与一个稳定的元音和擦音不同。当激励和声道特性改变时,所得到的声音信号特性随时间发生变化。因此,适用于平稳随机信号的标准傅立叶变换不能直接用于声音信号。对声音频谱分析应能得到时变频谱参数。但在相对短的时隙内,声音信号可看作准周期性序列。将短时分析思想应用于声音频谱分析,可得到声音时变频谱。1.3本课题的主要任务从上面简单的介绍可以看出,传统的频谱分析仪不能象通用计算机那样,对过去记录下来的信号进行非实时处理,它只有加上输入信号才能进行分析。然而,基于S3C2410频谱仪可以象通用计算机一样用作非实时处理。基于S3C2410频谱仪的缺点是,在目前S3C2410芯片制

20、造技术的条件下,可以实时处理的最高频率只达到兆赫的数量级,更高频率的信号可以进行非实时处理,实时处理有待于S3C2410芯片速度的进一步提高,或者增加测量手段。根据现有的条件,本文所要研究的是一个基于S3C2410的声音信号频谱分析系统。本系统以ARM9为基础,利用ARM9强大的数据处理能力来对采集到的声音信号进行频谱分析。声音信号是时变信号,然而,声音信号的特性随时间变化比较缓慢,大致可以认为在每10ms至30ms短时时间间隔内信号的特性基本不变,可以认为是时不变的。女性的基音频率从100Hz至500Hz,男性的基音频率为50Hz至250Hz,频率分辨率必须兼顾男女性。对于本频谱分析系统软件

21、设计是非常重要的一环,我们是基于这样的思想来进行软件设计的。软件设计主要实现的功能有基音检测、频谱分析及分析结果在PC机屏上显示。2 声音信号的时域分析语言是声音的声学表现,是人类信息交流最自然、最有效、最方便的手段,也是人类进行思维的一种依托。人类开始进入了信息化时代,用现代手段研究声音处理技术,使人们能够更加有效地产生、传输、存储和获取声音信号,这对于促进社会的发展具有十分重要的意义。声音信号是一个时间序列,进行声音分析时,最直观的就是它的时域波形。时域分析直观明了,计算简单且运算量小(相比后面将要介绍的频谱分析)。时域分析提供了最基本也是很重要的用于声音分析的参数,广泛用于声音的预处理等

22、方面。2.1 声音信号的抽样及其数字化模拟声音信号是连续信号,无法被DSP处理。因此声音处理的第一步是将模拟信号转化为数字信号,也就是常说的模/数转换,这其中主要包括两个步骤:采样和量化。声音信号是随时间而变的信号,它所占据的频率范围可达10kHz以上,但是对声音信号清晰度和可懂度有明显影响的成份,最高频率约为5.7kHz。但声音信号本身冗余度是比较大的,少数辅音清晰度下降并不明显影响语句的可懂度。一个正常人声音的频率一般在40Hz4000Hz的范围内,成年男子的声音频率较低,妇女和儿童的声音频率较高。电话声音频率范围在60Hz3400Hz左右。现代的声音合成或识别系统中,需将声音频率的上限提

23、高到10kHz左右。根据奈奎斯特采样定律(Nyquist Sampling Theorem),采样频率应为原始声音频率的两倍以上,考虑到滤波器性能的影响,这个阈值还应该提高。一般来说,电话声音的采样率为8kHz(G.71 1标准),普通声音的采样率在15kHz20kHz左右。否则,如果采样率不满足采样定律,将会产生频谱混叠,使信号中的高频失真。考虑到高频噪音的存在,为了防止频率高于二分之一采样频率的高频噪音产生频谱混叠,通常声音信号在采样前要进行一次预滤波以滤掉高频噪音。预滤波还有一个目的是避免50Hz的电源干扰,因此预滤波是一个带通滤波器,其下截止频率=50 Hz,上截止频率根据需要定义。采

24、样后的声音数据要能为DSP所存储和处理还必须进行量化处理。量化过程中,不可避免地会引入误差。量化时,如果采用较多的量化级数来记录样点的幅度,量化误差就较小,相应的比特(Bit)数就会增多。但是这是以增加存储容量和处理时的计算量为代价的,因此必须根据应用场合合理地选择量化字长。2.2声音信号的时间依赖由于人自身的发音器官的运动,声音信号是一种典型的非平稳信号。但是,由于声音的形成过程是与器官的运动密切相关的,这种物理运动比起声音振动速度来要缓慢得多,因此声音信号常常可假设为短时平稳的,即在1030ms这样的时间段内,其频谱特性和某些物理特征参量可近似地看作是不变的。几乎所有的声音信号处理方法都是

25、基于这个假设。这样,我们就可以采用平稳过程的分析处理方法来处理了。以后的几乎所有的处理方法都立足于这种短时平稳的假定。本章所要讨论的短时能量、短时平均差幅度以及自相关函数,都是在这种短时平稳假设下从时域来分析一些物理参量。这种时间依赖处理的基本手段,是用一个长度有限的窗序列w(m)截取一段声音信号来进行分析,并让这个窗滑动以便分析任一时刻附近的信号,其一般表达式为: (2.1) 其中T表示某种运算,x(m)为输入信号序列。几种常用时间依赖处理方法是:当Tx(m)为时,相应于短时能量;当Tx(m)=|sgnx(m)一sgnx(m-1)|时,就是短时平均过零率;当Tx(m)为x(m)x(m+k)时

26、,就是短时自相关函数。式(21)是卷积形式的,因此Q可以理解为离散信号Tx(m)经过一个单位冲激响应为w(m)的FIR低通滤波器产生的输出,如图21所示。线性滤波器T 低通滤波器图2.1短时分析原理的一般表示由于窗函数一般取为(x,z)中间大两头小的光滑函数,这样的冲激响应所对应的滤波器具有低通特性。其带宽和频率响应取决于窗函数的选择。用得最多的三种窗函数是矩形(Rectangular)窗、汉明(Hamming)窗和汉宁(Hanning)窗。1) 矩形窗 矩形窗属于时间变量的零次幂窗。矩形窗使用最多,习惯上不加窗就是使信号通过了矩形窗。这种窗的优点是主瓣比较集中,缺点是旁瓣较高,并有负旁瓣,导

27、致变换中带进了高频干扰和泄漏,甚至出现负谱现象。 2) 三角窗 三角窗亦称费杰(Fejer)窗,是幂窗的一次方形式。与矩形窗比较,主瓣宽约等于矩形窗的两倍,但旁瓣小,而且无负旁瓣。 3) 汉宁(Hanning)窗 汉宁窗又称升余弦窗,汉宁窗可以看作是3个矩形时间窗的频谱之和,或者说是 3个sin(t)型函数之和,而括号中的两项相对于第一个谱窗向左、右各移动了/T,从而使旁瓣互相抵消,消去高频干扰和漏能。可以看出,汉宁窗主瓣加宽并降低,旁瓣则显著减小,从减小泄漏观点出发,汉宁窗优于矩形窗但汉宁窗主瓣加宽,相当于分析带宽加宽,频率分辨力下降。这些窗函数都有低通特性。矩形窗的主瓣宽度最小,但其旁瓣高

28、度最高;汉明窗的主瓣最宽,而旁瓣高度最低。汉宁窗和汉明窗的差异在于前者随频率增加衰减很快,而后者基本保持一个常量。矩形窗的旁瓣太高,会产生严重的泄露现象(Gibbs),因此只在某些特殊场合中采用;汉宁窗衰减太快,低通特性不平滑;汉明窗旁瓣最低,可以有效地克服泄露现象,具有更平滑的低通特性。汉明窗由于其平滑的低通特性和最低的旁瓣高度而得到最为广泛的应用。长窗具有较高的频率分辨率,但具有较低的时间分辨率;短窗的频率分辨率低,但却具有较高的时间分辨率。对于同一种窗函数,主瓣宽度与窗长成反比,一般说来,窗长越长,它对信号的平滑作用越厉害,如果想要反映变化快的信息,应该缩短窗长。在对声音信号进行短时傅立

29、叶分析时,窗的长度的选择必须折中进行考虑。一方面,短窗具有较好的时间分辨率因而能够提取出声音信号中的短时变化,但同时却损失了频率分辨率。还应当注意到,声音信号的基音周期是有一个覆盖范围的,因此,窗宽的选择还应当考虑到这个因素。2.3 短时自相关函数2.3.1 自相关函数的定义和性质能量有限信号x(m,z)的自相关函数定义为: (2.2)信号的自相关函数具有一些有用的性质:(1)偶性:(2),即零滞后自相关值最大。(3)若x(n)为能量有限信号,则其能量为;2.3.2短时自相关函数这种修正自相关函数又称为协方差函数,它不具有偶对称性,即。自相关函数的计算,除直接计算之外,还有多种快速算法。例如:

30、快速傅立叶变换法、递归计算法等。目前,高速数字信号处理器可以在一个很短的指令周期内做一次乘加运算,而且专为卷积运算、递归运算设计了一些效率很高的运算指令。所以,如果采用数字信号实现自相关运算,常常是直接进行计算反而更加简单有效,不必采用结构复杂的快速算法。自相关计算在功率谱估计、线性预测分析和基音检测等方面经常用到。2.4基音周期估计方法基音周期(或基音频率)是声音信号的一个重要参数,在声音产生的数字模型中它也是激励源的一个重要参数。在声音分析、声音合成和声音识别中,估计基音周期都是一个重要任务。浊音信号是一种准周期性信号,其周期称为基音周期。由于它只是准周期性的,所以只能采用短时平均方法估计

31、其周期,基音周期估计也常称为基音周期检钡,t(PitchDetection)。前两节介绍的自相关函数和短时平均幅度差函数都能反映原信号的周期,因此它们可构成两种最常用的基音检测方法。声音信号包含十分丰富的谐波分量,基音频率最低可达80Hz左右,最高可达500Hz左右,但基音频率处在100Hz200Hz的情况占多数。因此,浊音信号可能包含有三四十次谐波分量,而其基波分量往往不是最强的分量。因为声音信号的第一共振峰通常在300HzlkHz范围内,这就是说,28次谐波成份常常比基波分量还强。丰富的谐波成份使声音信号的波形变得非常复杂,给基音检测带来了困难,经常发生基频估计结果为其实际基音频率的二、三

32、次倍频或二次分频的情况。加之还有清浊混杂等情况,使基音检测和清浊判别成为一大难题。可以说,至今没有一种万能的方法在任何情况下都能准确可靠地估计出基音周期。值得注意的是,从估计基音周期的角度来看,短时自相关函数所包含的信息有许多是多余的。真正反映基音周期的只是其中少数几个峰值,而其余大多数都是由于声道的谐振特性引起的。因此,为了突出反映基音周期的信息同时压缩与此无关的信息,就应该对声音信号进行适当的预处理。2.4.1 基音检测预处理由于声道的共振峰特性会对基音周期造成干扰,为了提高自相关法和平均幅度差函数法检测基音周期的可靠性,采用两种预处理方法对原始信号进行预处理:(1)中心削波处理。对于估计

33、基音周期真正有用的只是出现在基音周期处的自相关峰,其余较低的峰都是多余的。有用的自相关峰是由于声音信号中的一些最高峰形成的,这些最高峰是由于准周期激励脉冲产生的;无关的峰是声道对激励脉冲产生的响应。基于这种认识,完全有理由采用中心削波处理去掉声音信号中所有低振幅部分而仅保留高振幅的峰值。(2)先对声音信号进行低通滤波,然后计算短时自相关函数。这样处理的依据是,声音信号的基音频率一般都在500Hz以下,即使女高音升C调最高也不会超过lkHz。因此,从只保留基音频率的角度出发,用低通滤波器事先对声音信号进行滤波是有好处的。用一个通带为900Hz的线性相位低通滤波器滤除高次谐波分量,这样处理以后的信

34、号,基本上只含有第一共振峰以下的基波和谐波分量。实验表明,用这种方法作预处理,对改善自相关法和平均幅度差函数法的基音检测都有明显的效果。2.4.2自相关法基音检测算法由短时自相关函数的定义可知,对于准周期信号,短时自相关函数在基音周期的各个整数倍点上有很大的峰值。如果我们能求得第一最大峰值点并计算其与零点的距离,该距离就是估计出来的基音周期。下面结合L.R.Rabiner一篇论文中介绍的具体例子来叙述这种自相关基音检测算法计算步骤。这里设信号的采样率10kHz,窗序列采用300点长的矩形窗,连续分析信号时采有10ms(且P 100个样点)的帧问隔,即每相邻两帧重叠200个样点。截止频率为900

35、Hz的低通滤波器是一个20阶线性相位的有限冲激响应滤波器。下面是对每一帧进行基音周期估计的计算步骤:(1)用900Hz低通滤波器对一帧声音信号x(n)进行滤波,并去掉开头20个输出值不用(置0),得到x(n);(2)分别求 x(n)的前部100个样点和后部100个样点的最大幅度,并取其中较小的一个,乘以因子0.68作为门限电平;2.4.3基音检测的后处理声音信号的周期性从波形上观察可以看得很明显,但是其形状表现得比较复杂,自动基音检测算法很难做到处处准确可靠。基音周期估值落在其实际基音的倍频或分频所对应的周期等情况时有发生。没有任何一种预测方法能够准确计算出所有的基音周期。往往大部分的点是比较

36、准确的,但是也有一部分偏离到标准值的两倍或一半的点,好在声音信号的基音频率通常是连续地缓慢变化的,因此可以采用某种平滑技术来纠正个别估值的错误。常用的平滑技术有三种:(1)中值滤波平滑处理中值平滑处理是一种采用滑动窗的直方图统计处理的方法。其基本原理是:设x(n)为输入信号,y(n)为中值滤波器的输出,窗长为2L+l,那么此处的输出值y()就是将窗的中心移到处时窗内输入样点的中值。所谓中值就是将窗内的2L+1个输入样本进行统计,求出一个累计直方图,其中1/2分位数就是中值。例如五点窗,若窗中心处于处时,相应的五个输入样本值依次为:x(2),x(-1),x(),x(+1),x (+2)=4,5,

37、0,6,6。显然,它们的中值为5,那么中值滤波器的输出值Y()就是5,而原输入信号X()=0,通过中值滤波得到了纠正。然后滤波窗向后平移一个样点,用同样的方法求出窗内样本的中值,即得到Y(no+1)。如此进行下去,中值滤波可以纠正个别奇异点而不影响周围的样点的值。(2)动态规划平滑处理动态规划平滑处理的基本思想是:定义一个代价函数,由每一步寻找最低累计代价的路径,达到最终累计总代价最小。 3 声音信号频域分析大量的实验表明,人类感知声音的过程和声音本身的频谱特性关系密切。人类本身的听觉对声音的频谱特性更为敏感。两段时域上相差很大的声音如果具有类似的频谱特性,人类在感知它们时的感觉也是相似的。声

38、音信号的频谱具有非常明显的语言声学意义,能反映一些非常重要的声音特征,比如共振峰频率和带宽等。因此,对声音信号进行频谱分析,是认识声音信号和处理声音信号的重要方法。傅立叶变换是分析线性系统和平稳信号稳态特性的强有力手段,它在许多工程和科学领域中得到了广泛的应用。这种以复指数函数为基函数的正交变换,理论上很完善,计算上很方便,概念上易于为人们理解,在声音处理领域也是一个非常重要的工具。声音信号是一种典型的非平稳信号,但是其非平稳性是由发音器官的物理运动过程而产生的。这个物理运动过程与声波振动的速度比起来要缓慢得多,因此我们可以假定它在10ms30ms这样短的时间段中是平稳的,用前一章所述的时间依

39、赖方法来进行分析处理。短时傅立叶分析,就是在基于短时平稳的假定下,用稳态分析的方法处理非平稳信号的一种方法,也可称为时间依赖傅立叶变换。3.1 频谱分析原理与方法3.1.1频谱分析原理频谱分析主要是指离散傅立叶变换的谱分析。众所周知,任何信号都可以视作无限个不同频率的正弦交变信号的叠加,在数学上它由傅立叶序列来表述。假设有一周期信号x(f),其周期为乃那么它的傅立叶序列为: (3.1)式中,为傅立叶系数,为各次谐波的频率。对于某一瞬时态信号可以设定其周期丁趋向无穷大,这时序列可以化为: (3.2)这里傅立叶系数变为连续的频率函数: (3.3)式(3.3)即是著名的傅立叶变换,式(32)是傅立叶

40、反变换,如果将信号x(f)经A/D采样变成数字信号序列x(t),则对照式(3.3)可以得出离散傅立叶变换及其逆变换如式(3.4)和(3.5)所示: (3.4) (3.5)式中n,k为序列号,N为数字信号序列的点数。若A/D转换的频率是Z,且采样点数为偶数,则序列号k=N/2处代表的频率为Z/2,序列号k=l处代表的频率为T/N,其它后代表的频率以此规则类推。当采样点是2的整数次方时,即可用著名的基2的FFT算法进行快速运算,获得Y(k)。一般Y(k)的值是复数,对其求模即得该频率下谱的幅度,一系列的模则构成x(n)的离散化的幅度谱(即通常讲的频谱),基于FFT的谱分析称为线性谱分析。当k固定时

41、的Y(k)的虚部与实部之比即为该频率成份下的相位,由此还可以构成相位谱。如果获得x(n)点数不足2的整数次方,最简单的办法就是在实际的x(n)后补若干零值,使其满足总点数为2的整数次方,这样就可以用常规的FFT算法。但由于增加了FFT的计算长度,耗时量会显著加大,因此在目标信号的时间动态许可范围内应尽可能减少x(n)的点数。另外,对x(n)的A/D采样频率也要满足奈奎斯特抽样定律,该定理描述如下:假设x(f)是一个时间函数,它的最高频率为Z(截止频率),则若|f|时,x(t)的傅立叶变换X(f)=0,那么,该函数x(t)可以完全由时间间隔的时域抽样(或者说抽样频率)序列唯一确定,即函数x(t)

42、可以表示为: (3.6)显然,抽样定理包含着两个限制,一是频率函数的带宽限制,即时,x(f)=0;一是对抽样间隔的限制,即=1/(2),它也是最大的抽样问隔。这种等间隔的抽样又叫奈奎斯特(Nyquist)抽样,叫做奈奎斯特抽样频率。抽样定理指的是采样频率。实际应用中,一般保留一定的余量,取得比奈奎斯特采样频率高于此。3.1.2频谱分析方法进行FFT运算时,一般先用各种窗函数给x(n)加权,然后再进行FFT运算,这样可在一定程度上改善起伏现象。FFT的另一个不足是其分辨率往往较低,即使在x(n)后补上大量的零点,也只能减小FFT运算上Y(k)的离散化间隔,实际上并不能帮助使用者明确频谱的真正细节

43、,且增加零点数造成FFT运算的点数增加,使运算速度大大降低。鉴于FFT分辨力不足的问题,可以用高分辨力的非线性谱分析方法。非线性谱分析的方法很多,如AR模型方法、自回归滑动平均(ARMA)模型方法、量小交叉嫡方法等,其中AR模型方法问世较早,研究与应用都比较成熟,且有多种较快运算速度的算法。除此之外,由于傅立叶变换无时间局部信息,也就是说,信号x(f)任何时刻的微小变化都会牵动整个频谱;反过来,任何有限频段上的信息都不足以确定在任意时间小范围内的函数x(t)。为了了解实时信号的局部特性,发展起来了预先加窗的办法,使频谱反映时间局部特性。因此,出现了许多基于傅立叶变换的谱分析方法。经常应用于工程

44、实践的除了FFT,还有短时傅立叶变换(STFT)、子波变换(WT)和ZOOM-FFT。从数学上看,三种不同的变换都是将所研究的信号在一组特定基函数上的分解问题,但由于基函数不同,就有了不同的分辨率特征。变换的分辨率特性完全取决于基函数的特征,即基函数的频率带宽和持续时间。FFT是在单频上做分解,即=0,频率分辨率可以任意设置,但基函数在时问轴上无限延伸=,故无时间分辨率。STFT法一旦窗函数选定,基函数的包络不再改变,只是载波改变,其频宽和时宽也就确定,所以,时间和频率分辨率在整个时频平面固定不变。而且,由于一个窄的波形有一个宽的谱,而一个宽的波形有一个窄的谱,波形和频谱的宽度两者不能同时兼顾

45、,即满足下式所揭示的“不确定性原理或称“测不准原理”: (3.7)在分析信号,尤其是在分析声音和图像信号的时候,不同的频率上需要有不同的分辨率,低频处应该有较高的频率分辨率,而在高频段频率分辨率可以降低,使频率分辨率随频率f而改变。基于此研究背景,为了解决FFT和STFT中时间分辨率与频率分辨率之间的矛盾,提出了子波变换。子波变换(WT)的公式如下: (3.8)WT的基函数是基本子波的伸缩和平移,取基本子波,g(t)为高斯函数,令,若a减小,包络压缩,同时f增大,载频升高,也增大。而ZOOMFFT是用“局部细化放大的方法,使感兴趣的重点频区得到较高的分辨率,若轮流按频区逐段细化,还可以使整个频

46、谱图得到详细的分析。目前有两种细化方法,一种是对某一局部的波形做简单的放大,它并不提高分辨率,比较容易实现:另一种是将局部频段重新处理后得到的较原来频谱图上分辨率远为提高的频谱图。应用最广泛的是移频式ZOOM-FFT方法,它基于DFT变换的移频原理,将信号乘以单位旋转因子后,就能把频率移至所需细化的处,频率分量停留在频率为0处的位置上。这样就形成了一个以为频率起点的新的信号,然后再将由此做始点的频率截出感兴趣的频段,按普通FFT工作步骤做频谱图,得到的是以为起始点,有限范围频段的细化频谱。综上所述,目前发展起来了很多种频谱分析方法,这些方法都以傅立叶变换为基础的,可以根据不同的检测目的和要求来选用不同的方法。3.2傅里叶变换的原理及算法3.2.1 傅立叶变换的基本定义一个波形的傅立叶变换,其实质是把这个波形是把这个波形分解成许多不同频率的正弦波之和。如果被分解的波形为x(f),那么傅立叶变换在数学上可表示成:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究报告 > 信息产业


经营许可证编号:宁ICP备18001539号-1