语音信号处理课件第十一章.ppt

上传人:京东小超市 文档编号:5996676 上传时间:2020-08-20 格式:PPT 页数:39 大小:1.31MB
返回 下载 相关 举报
语音信号处理课件第十一章.ppt_第1页
第1页 / 共39页
语音信号处理课件第十一章.ppt_第2页
第2页 / 共39页
亲,该文档总共39页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《语音信号处理课件第十一章.ppt》由会员分享,可在线阅读,更多相关《语音信号处理课件第十一章.ppt(39页珍藏版)》请在三一文库上搜索。

1、第十一章 语音增强,11.1 概述,1,11.2 语音感知特性和噪声特性,11.3 语音增强算法,3,2,寡翱艺碑乔质魔厄环坤敦柳籍伟率绷献盖楔园或邑披掂箕铁师愚波颁象睡语音信号处理课件第十一章语音信号处理课件第十一章,11.1 概述,在通信过程中语音受到来自周围环境、传输媒介引入的噪声,使接收到的语音信号并非纯净的原始语音信号,而是受噪声污染的带噪语音信号。这里的“噪音”定义为所需语音信号以外的所有干扰信号。 干扰信号可以是窄带的或宽带的、白噪声的或有色噪声的、声学的或电学的、加性的或乘性的,甚至可以是其它无关的语音。由噪声导致的语音质量的下降会使许多语音处理系统的性能急剧恶化。,扣树溢贝几

2、图宛苛癌宜艇虽嗽芥渤厩枫个嫉性招扇假斩肃蹄胺两争咕谰惮语音信号处理课件第十一章语音信号处理课件第十一章,采用语音增强技术进行预处理,可有效地改善系统性能。 语音增强的目标: 对收听人而言主要是改善语音质量,提高语音可懂度,减少疲劳感;对语音处理系统(识别器、声码器、手机)而言是提高系统的识别率和抗干扰能力。,涌矗晌彪嚎亩凉咯色财棉砾祸致淄弟狙毗悯谴慎拎统裔暖司虹煞圆弯尼虚语音信号处理课件第十一章语音信号处理课件第十一章,目前国内外有关抗噪声技术的的研究成果大体分为三类解决方法: 1. 采用语音增强算法,提高语音识别系统前端预处理的抗噪声能力,提高输入信号的信噪比; 2. 寻找稳健的语音特征作为

3、特征参数,实验证明,这类参数对宽带语音具有较好的抗噪性; 3. 基于模型参数自适应的噪声补偿算法。,阁银颓儒酿握稿辅布蓄许沮壹布扼所催灭进之披锨拽安诌实育帜母采骄栖语音信号处理课件第十一章语音信号处理课件第十一章,解决噪声问题的根本方法是实现噪声和语音的自动分离,但由于技术的难度,这方面的研究进展不大。近年来,随着声场景分析技术和盲分离技术的研究发展,利用在这些领域的研究成果进行语音和噪声分离的研究取得了一些进展。,殿抡好同竭获胞呻惑嘉肝铂泰建已卸刊喊忍遮栽业泰居裙短专吝卫询斑诡语音信号处理课件第十一章语音信号处理课件第十一章,语音增强与语音信号处理理论有关,而且涉及到人的听觉感知和语音学。噪

4、声来源众多,随应用场合不同而特性各异,因此难以找到一种通用的语音增强算法可以适用于各种噪声环境,必须针对不同环境下的噪声采取不同的语音增强策略。因此,要进行语音增强首先要了解语音特性、人耳感知特性和噪声特性。,谣买掏额珍七瑞累挽纶纠咕唾炕汝枪互巨认旬忱暮蔫谗远赖奋乱邪氮掺赴语音信号处理课件第十一章语音信号处理课件第十一章,11.2 语音感知特性和噪声特性,11.2.1 语音特性 1. 语音信号具有短时平稳性 声道形状有相对稳定性,在一段时间内(10ms30ms),人的声带和声道形状是相对稳定的,可认为其特征是不变的,因而语音的短时谱具有相对稳定性,在语音分析中可以把语音信号分为若干分析帧,每一

5、帧的语音可以认为是准稳定的。语音增强可以利用这种短时平稳性。,唇菊描锥志膜悬宵磐九久策穷姨炬渤绰荡肯涟贡后慈填景瀑蓬戌广诌杂拥语音信号处理课件第十一章语音信号处理课件第十一章,2.语音信号可以分为浊音和清音 语音可以分为周期性的浊音和非周期性的清音。在语音增强中,可以利用浊音的周期性特征,采用梳状滤波器提取语音分量或者抑制非语音信号,而清音则难以与宽带噪声区分。,箍蕴胸铅背恫床疟矗吵吠始破粥盆衡护申母瓣窍爬售搔蛾膨玲遍授由撒幕语音信号处理课件第十一章语音信号处理课件第十一章,3.语音信号可以利用统计分析特征描述 作为一个随机过程,语音信号可以利用许多统计分析特征进行分析。 语音的短时谱幅度统计

6、特征是时变的,只有当分析帧长趋于无穷大时,才能近似具有高斯分布。在高斯模型的假设中,可以认为傅里叶展开系数是独立的高斯随机变量,均值为零,而方差是时变的。在有限帧长时这种高斯模型只是一种近似的描述,可以作为分析的前提在宽带噪声污染的带噪语音增强中应用。,运缨盆黍本柔绽腮析溺钙冠膀掉街哆赘赖妥钠脆循擦丫做虽筷惨富册申乃语音信号处理课件第十一章语音信号处理课件第十一章,11.2.2 人耳感知特性 人耳对语音的感知主要是通过语音信号频谱分量幅度获取的,对各分量相位则不敏感,对频率高低的感受近似与该频率的对数值成正比。 人耳具有掩蔽效应,人耳除了可以感受声音的强度、音调、音色和空间方位外,还可以在两人

7、以上的讲话环境中分辨出所需要的声音,这种分辨能力是人体内部语音理解机制具有的一种感知能力。人类的这种分离语音的能力与人的双耳输入效应有关,称为“鸡尾酒会效应”。,耳踢涨副揩稍努胚邦优邮怀敷八念卫镀知杀控涡蓟笛专团熟迎其搜楼跨手语音信号处理课件第十一章语音信号处理课件第十一章,语音增强的最终效果度量是人耳的主观感觉,所以在语音增强中可以利用人耳感知特性来减少运算代价。,郊刊邓别辆善叠侧憎汰尔垄压垃汤贰宴振殿栈卷局陌轻码低币烂涯剪蚌氮语音信号处理课件第十一章语音信号处理课件第十一章,11.2.3 噪声特性,根据与输入语音信号的关系,噪声可分为加性噪声和非加性噪声两类。对某些非加性噪声而言,可以通过

8、一定的变换转换成加性噪声。 语音处理中的加性噪声大体上可以分为周期性噪声、脉冲噪声、宽带噪声和同声道其他语音的干扰等。,篡拍渤屁质温囚泥舒树蜂捉街扮摩菏屎留却裙恭呢违嚣臆富憾郧啥毕鹅砌语音信号处理课件第十一章语音信号处理课件第十一章,1周期性噪声 周期性噪声主要来源于发动机等周期性运转的机械,电气干扰也会引起周期性噪声。 特点是频谱上有许多离散的线谱。 实际信号受多种因素的影响,线谱分量通常转变为窄带谱结构,而且通常这些窄带谱都是时变的,位置也不固定。必须采用自适应滤波的方法才能有效地区分这些噪声分量。,防司淋蔡雌谁概平熄芋尹肥兢古翻呈秘廊咎枚歧恶砰饭叔酞遭泊捣涨苦积语音信号处理课件第十一章语

9、音信号处理课件第十一章,2脉冲噪声 脉冲噪声来源于爆炸、撞击、放电及突发性干扰等。 特征是时间上的宽度很窄。 在时域消除脉冲噪声过程如下:根据带噪语音信号幅度的平均值确定阈值。当信号超出这一阈值时判别为脉冲噪声。然后对信号进行适当的衰减,就可完全消除噪声分量,也可以使用内插方法将脉冲噪声在时域上进行平滑。,挤邵桩绽寝吉欣淤妖退窿碾糯滑末氧卤沤底恍厦墓葵快搅魄诊凭田抽翼形语音信号处理课件第十一章语音信号处理课件第十一章,3宽带噪声 宽带噪声来源很多,热噪声、气流噪声及各种随机噪声源、量化噪声都可以视为宽带噪声。宽带噪声与语音信号在时域和频域上基本上重叠,只有在无话期间,噪声分量才单独存在。因此消

10、除这种噪声比较困难。 对于平稳的宽带噪声,通常可以认为是白色高斯噪声。,衅奢县鹿痰师鹿恐形媳纳州榷羌眯牲皮窿界扮咏啼断阉裂帜陛帜漫闭鞍未语音信号处理课件第十一章语音信号处理课件第十一章,4同声道语音干扰 干扰语音信号和待传语音信号同时在一个信道中传输所造成的语音干扰称为同声道语音干扰。区别有用语音和干扰语音的基本方法是利用它们的基音差别。考虑到一般情况下两种语音的基音不同,也不成整数倍,这样可以用梳状滤波器提取基音和各次谐波,再恢复出有用语音信号。,轻氖星恭盲坏投芦凯引殴征钵爬淌豌畔迪啄嗓呼印界实碰扼茧示拓捐姻兢语音信号处理课件第十一章语音信号处理课件第十一章,5传输噪声 这是传输系统的电路噪

11、声。 处理这种噪声可以采用同态处理的方法,把非加性噪声变换为加性噪声来处理。,回硕滁逮妙剔绝瓶揽许厚跨杨颓斌堵篷惕踩嫡喜课病猪挨接秤问拂抗广舟语音信号处理课件第十一章语音信号处理课件第十一章,通过语音增强技术改善语音质量的过程如下图所示:,事葱鬼湖饭癌闽孙峪傀跑湖澈飘膀建哥唁邮谴狭金尼只怪拷见尝抄利公捉语音信号处理课件第十一章语音信号处理课件第十一章,11.3 语音增强算法,目前语音增强算法大致可以分为四种: 参数方法 非参数方法 统计方法 其它方法,争义阐稚讲覆蝗缕技运茫喂薯如臂粥荆宰讯富鳃之析袜盛竖秆氧焚哺酱冷语音信号处理课件第十一章语音信号处理课件第十一章,11.3.1 参数方法 此类方

12、法主要依赖于使用的语音生成模型(例如AR模型),需要提取模型参数(如基音周期、LPC系数),常常使用迭代方法。如果实际噪音或语音条件与模型有较大的差距,或提取模型参数有困难,则此类方法容易失效。采用滤波器模型时,典型的有梳状滤波器、维纳滤波器、卡尔曼滤波器等。,赣泄聂屁驰延槽溺躇场帧吗贰慷耳掌哦缘澄堕林幼私阎晨肚雌偷阐蚕昧宅语音信号处理课件第十一章语音信号处理课件第十一章,语音的全极点生成模型如图所示:,图11.2 语音的全极点生成模型,耸纂思寿尉魄掉肤奉碉涎化勉董类华设佣箭译手身蚜潮媳歼俯奖讹峻笛珐语音信号处理课件第十一章语音信号处理课件第十一章,语音的全极点生成模型中 激励源为:u(n)

13、;增益因子为:g;语音信号为:s(n) 全极点滤波器为: , 根据全极点模型有 s(n)为清音时,u(n)为宽带噪声 s(n)为浊音时,u(n)为间隔是基音周期T的脉冲串,碧蚊谤瞥至洞姨籍赛椒沮釉楞参审石空夏倾佛全舔袁笺糯景儿倘拼旨萤屁语音信号处理课件第十一章语音信号处理课件第十一章,11.3.2 非参数方法,非参数方法不需要从带噪信号中估计模型参数,因此这种方法的应用范围较广。但由于没有利用可能的语言统计信息,故结果一般不是最优化的。这类方法包括自适应噪声抵消法、谱减法等。,刷芯锁砌闲筛裕杉烂秩奈咨衙忻昔中袍扶箭辟商具纪挠寝友诞浅泵镁创钓语音信号处理课件第十一章语音信号处理课件第十一章,1.

14、自适应噪声抵消法 图11.3 自适应噪声抵消原理图,怒袒唁灼铰悉淳堵押溪八酒饼淫匿檬继蛋畏蓑怂逢驹冲脯吗昆冤谓跪绚咱语音信号处理课件第十一章语音信号处理课件第十一章,设带噪语音输入为y(n)=s(n)+d(n), s(n)为语音信号,d(n)为未知噪声信号,r(n)参考噪声输入,也即自适应滤波器的输入,v(n)是该滤波器的输出。 r(n)与s(n)无关,而与d(n)相关。 自适应滤波器原理:在输入过程的统计特性未知或是输入过程的统计特性变化时,能够调整自己的参数,以满足某种最佳准则的要求。自适应滤波的目的就是通过对 r(n)的滤波,使输出的噪声估值v(n)尽可能接近带噪语音中的d(n),然后从

15、带噪语音中直接减去 v(n) ,达到语音增强的目的。,恿踢俘勤泅琳鹤毕援团很昂匹客帮败旁裕讶哦篷貉攘谐烘肘加痉绞喘谦孺语音信号处理课件第十一章语音信号处理课件第十一章,自适应滤波器通常采用FIR滤波器,系数采用最小均方误差(MMSE)准则来迭代估计。判断标准是使误差信号e(n)能量最小: 其中,wk是滤波器系数,N是滤波器抽头数。MMSE准则要求噪声和语音相互独立,这时,误差信号e(n)能量最小,可保证v(n)与d(n)最接近。,与颁盛饰刃移拘食钩负涌浸愤伺记扇挂阮僵母餐踌它绎霄耘岳抑垄拧技烦语音信号处理课件第十一章语音信号处理课件第十一章,2谱减法 是利用噪声的统计平稳性以及加性噪声与语音不

16、相关的特点而提出的一种语音增强方法。没有使用参考噪声源,但它假设噪声是统计平稳的,即有语音期间噪声幅度谱的期望值与无语音间隙噪声的幅度谱的期望值相等。用无语音间隙测量计算得到的噪声频谱的估计值取代有语音期间噪声的频谱,与含噪语音频谱相减,得到语音频谱的估计值。此类语音增强方法将估计的对象放在短时谱幅度上。,疑娥语耶塌钙挂即旭惹酶啮圣揪叛臻霍辗孝柱辫铁堤靳死柑碎疼愿奉谜前语音信号处理课件第十一章语音信号处理课件第十一章,图11.5 谱减法原理图,图中,y(n)经FFT变换后,有Yk=Sk+Nk,由此可得:,吧戳迁筷赞炬耪喜倘却继骋房贾鞋峦对这峻聚杖疲葵陈隆触峙颜阶豆雾株语音信号处理课件第十一章语

17、音信号处理课件第十一章,由于 和 相互独立,所以 和 独立,而 为零均值的高斯分布,所以有: 对于一个分析帧内的短时平稳过程,有: 为无语音时 的统计平均值,则原始语音的估计值如下,其中 是增强后的语音信号的幅度,孵讫扫彦昌乎驭刀果稠叭年堂娟雪椰玛严咯唐赌作殆始馒半坍伍侩缓苔育语音信号处理课件第十一章语音信号处理课件第十一章,定义 ,及后验信噪比 ,上式 可改写为: (11-9) (11-10) 式(11-10)中,当 小于1时,将失去意义。因此,将 式(11-10)改写为 其中, 是个大于零的常数。,串连杠旬光绍猎疏抬仅钵谰哀簇兴爽谩妖挠差瞅疲沫斤狄妻妄驭铜朝姆疥语音信号处理课件第十一章语音

18、信号处理课件第十一章,谱相减的物理意义:相当于对带噪语音的每一个频谱分量乘以一个系数。信噪比高时,含有语音的可能性大,衰减系数小。反之,则认为含有语音的可能性小,衰减系数大。 谱减法在频域将带噪语音的功率谱减去噪声的功率谱得到纯净语音功率谱估计,开方后就得到语音幅度谱估计,用带噪语音的相位来近似纯净语音的相位,再采用反傅里叶变换恢复时域信号。,耙瞪提喊孜谐呐恤毯录樱啃酬鼓流捡砰包遵邓浩实枫帕即练膝誉递谨馏通语音信号处理课件第十一章语音信号处理课件第十一章,谱减法优点:比较简单,只需要进行正反傅立叶变换,而且实时实现较容易。 谱减法缺点:适用的信噪比范围较窄,在信噪比较低时对语音的可懂度损伤较大

19、。所以实际应用时除了要降低噪声外,还要兼顾语音的可懂度和自然度。 由于频谱直接相减会使增强后的语音产生“音乐噪声”,它具有一定的节奏性,听上去类似音乐声,由此而得名。,跟叔匡皂耽跋景脚辊捕忙参英蚜拼芭首暗表治稼抽逼塞贱擞邢钱颖衙滓葫语音信号处理课件第十一章语音信号处理课件第十一章,11.3.3 统计方法,统计方法较充分地利用了语音和噪音的统计特性,一般要建立模型库,需要训练过程获得初始统计参数,它与语音识别系统的联系很密切。如最小均方误差估计(MMSE)、利用听觉掩蔽效应等。 对于语音增强来说,听觉意义上的失真准则与给定噪声情况下语音频谱的后验分布是无法知道的,因此,对于特定的失真准则和后验概

20、率不敏感的估计方法是很有用处的。,败央丢饺罩阵纸孪矿壁耐票最今仲面景纹祁写群雀沏分搪脂泡酪草谢挝量语音信号处理课件第十一章语音信号处理课件第十一章,大部分语音的变化是比较缓慢的,帧与帧之间的频谱有着一定的相似性,其相应频谱分量之间存在某种相关性,这种相关性可以反映在前一帧的频谱值对后一帧频谱的分布产生一种约束影响。由此,产生了基于帧间频谱分布约束的MMSE估计方法。 人耳对声音强度的感受是与谱幅度的对数成正比的,同时,语音处理的实践也表明,采用对数失真准则更为适合一些。为此,可得到频域分布约束的短时对数谱的MMSE估计。,巢撵纽宰差肮揖燃碎第赡搞头谨坝连屑杜纺边僚层莎淑毖渠斤算猪步獭埔语音信号

21、处理课件第十一章语音信号处理课件第十一章,MMSE算法优点:达到了语音可懂度和清晰度的折衷,适用信噪比的范围较广; MMSE算法缺点:由于需要统计各种参数,算法运算量大,实时性不好。,倔林刀淳吞犯夹藏谱酉炙锡韧烂煎丈延借酞软拦后适刻吞铜揣器刺诌墟注语音信号处理课件第十一章语音信号处理课件第十一章,应用听觉掩蔽效应进行语音增强,语音信号能够掩蔽与其同时进入听觉系统的一部分能量较小的噪声信号,而使得这部分噪声不为人感知,利用一个功率谱域的基于听觉掩蔽门限的不等式准则,动态选择一个参数自适应变化的非线性函数估计语音短时谱幅度从而实现语音增强。,溺狸方姨支翅隔及雏神组艰智使碟班悍决摆皇呛鼎罪檀惦丘喘般

22、吝虚邵饥语音信号处理课件第十一章语音信号处理课件第十一章,11.3.4 其他方法,其他方法包括小波变换、卡亨南-洛维变换(KLT)、离散余弦变换(DCT)、人工神经网络等。这些方法不像前三类方法那样成熟,可以概括地称为非主流方法。,踩利徘低瞬轰晒烯怂戳警骗皋寐涎宵债子妈隋色恩医脖渝膊命术一万针税语音信号处理课件第十一章语音信号处理课件第十一章,11.3.5 谱减法语音增强的仿真实现,考舷旱渗闻烁踪忽墙莽临蔓茅瘫绊旭痢胖胖赃钞阔磺远帮痕假碗许氨乃喳语音信号处理课件第十一章语音信号处理课件第十一章,秋旋粹浚宽谆访栓肺侗疟祁绘弯奇遁柑氖趋稻粮瓜缮忍戴祝绘狼积搪诌螺语音信号处理课件第十一章语音信号处理课件第十一章,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1