(DOC) 基于最大信息熵的小波包阈值去噪语音增强算法
基于最大信息熵的小波包阈值去噪语音增
强算法
?
12?《测控技术)2011年第30卷第1O期
基于最大信息熵的小波包阈值去噪语音增强算法
杨桂芹,徐红莉
(兰州交通大学电子与信息工程学院,甘肃兰州730070)
摘要:去噪算法在语音增强中占有极为重要的地位.而传统的小波阈值去噪算法会不可避免地造成部
分有用语音信号的损失.为了更好地对含噪语音信号进行去噪,选用小波包分析法进行语音分解,采用
一
种新的阈值
,同时基于最大信息熵的原理确定了阈值和加权阈值函数中的权因子.仿真结果表
明,该算法能够很好地抑制噪声,保证重建信号质量.无论在听觉效果上还是信噪比指标上,均具有更
好的去噪性能.
关键词:最大信息熵;闽值;闽值函数;小波阈值去噪;语音增强
中图分类号:TN912文献标识码:A文章编号:1000—8829(2011)10—0012—03
AWaveletPacketThresholdDe-NoisingAlgorithmforSpeechEnhancement
BasedonMaximumInformationEntropy
YANGGui-qin,XUHong—li
(SchoolofElectronics&InformationEngineering,LanzhouJiaotongUniversity,Lanzhou730070,China)
Abstract:De—noisingalgorithmplaysaveryimportantpositioninthespeechenhancement,whilethetraditional
waveletthresholdde—noisingalgorithmwillcauselossofpartofusefulspeechsignalsinevitably.Inordertode—
noisethespeechsignalswithnoisebetter,awaveletpacketanalysismethodforvoicedecompositionisseleted,
andanewthresholdfunctionisused.Thethresholdandtheweightedfactorsintheweightedthresholdfunction
aredeterminedbythetheoryofmaximuminformationentropy.Thesimulationresultsshowthattheposedalgo—
rithmcansuppressnoisebetter,andensurethequalityofthereconstructedsigna1.Thede—noisingeffectisbet—
ternotonlyintheaudioeffectsbutalsointhesignaltonoiseratio.
Keywords:maximuminformationentropy;threshold;thresholdfunction;waveletthresholdde—noising;speech
enhancement
语音增强的目的就是从带有噪声的语音信号中提
取尽可能纯净的原始语音,提高信噪比,改善语音质
量.人们已提出了许多语音增强的算法,但由于语音
信号本身所具有的复杂性和非平稳性,加之噪声的多
样性,这些算法尚不尽如人意.
小波变换是近年来发展起来的去噪新方法.利用
信号和噪声的小波系数在各尺度上不同的分布特性,
采取阈值的方法,达到去除噪声的目的,特别适合于处
理非平稳信号.但是在小波分析中每次只对上次分解
的低频部分进行再分解,对高频部分不再分解,所以在
收稿日期:2010—10—16
基金项目:甘肃省自然科学基金资助项目(1010RJZA065)
作者简介:杨桂芹(1970一),女,河南许昌人,副教授,硕士,主
要从事现代数字通信理论与现代数字信号处理教学和科研
工作.
高频段分辨率较差.导致去噪的同时丢失了大量的语
音清音信息,严重影响重建信号质量.而小波包分析
不但对低频部分进行分解,而且对高频部分也进行了
二次分解,使其在信号去噪方面表现出明显优势,对信
号的分析能力更强.
在阈值去噪算法中,常用两种阈值函数:硬阈值函
数和软阈值函数.硬阈值函数的不连续性使消噪后的
信号仍含有明显噪声;采用软阈值方法虽然连续性好,
但估计小波系数与含噪信号的小波系数间存在恒定的
偏差,达不到更好的去噪效果.为此,笔者采用一种加
权阈值函数,利用最大信息熵原理确定阈值和加权阈
值函数中的权因子,仿真实验表明该算法具有较好的
语音增强效果.
1基于小波包分析的语音分解
假设带噪语音信号可表示为
基于最大信息熵的小波包闽值去噪语音增强算法?13?
()=s(|i})+(矗),(k=0,1,2,3,…,N一1)(1)
式中,(k)为含有噪声的语音信号;()为纯净语音
信号;()为
差为的高斯白噪声,服从标准正
态分布.
已知信号与白噪声在小波域表现出截然不同的特
点,语音信号由于具有奇异性,随着小波分解尺度的增
加,其小波系数的幅度值有逐渐增大的趋势.总体在
低频部分的能量较高,但高频分量较少.而高斯白噪
声总体杂舌L无章,不具有奇异性,信号中分布着大量高
频信号,而代表信号轮廓特征的近似信号相对较少.
随着小波分船尺度的增力g,高斯自噪声的能量分布逐
渐减少.当带噪信号经过小波分解后,相对来说,语音
信号的小波系数值必然大于那些能量分散且幅度较小
的噪声的小波系数值,据此依据最大信息熵原理,选择
一
个合适的阈值进行处理,可达到消除噪声而保留有
用信号的目的.
利用小波包对语音进行分解消噪的步骤:
(1)对语音信号进行小波包分解.
选择一种小波并确定小波分解层次,然后对信
号(jI=)进行层离散小波包分解,得到一组小波包
分解系数它由两部分组成:一部分是s()对应的
小波包系数,记为si;另一部分是()对应的小波包
系数,记为.
针对语音信号,由于语音信号的频率范围一般为
300,3400Hz,经过4层小波分解后,在第4层低频部
分的频率范围为0,500Hz,再做一次分解后,第5层
的低频部分的频率范围将低于语音信号的下限范围,
这部分将失去意义.因此本文对语音信号进行4层
分解.
(2)计算最佳树(最p确定最佳小波包基).
选用Shannon熵原则得出最佳小波包分姆树.
(3)小波包分解系数的阕值量化.
对于每个小波包分解系数,根据所选阈值函数及
最大信息熵原理,选择一个适当的阈值A,并对系数进
行阈值量化,得出估计小波系数刍,并使lf珏一smII
尽量小.
(4)语音的小波包重构.
根据第层的小波包分解系数和阈值量化处理
系数,利用进行小波包重构.
2阈值函数的选取
硬软阈值法虽在实际中得到了广泛应用,但这些
算法本身存在着一些缺陷.在硬阈值方法中,对大于
阈值的小波系数不加处理,但实际情况下大于阈值的
小波系数中也存在噪声,因此对噪声清除不够干净.
软阂值函数虽然连续性好,但估计小波系数与含噪信
号的小波系数问存在恒定的偏差,不可避免地给重构
语音带来误差,使语音清晰度大大降低.
已知噪声分量随着小波系数增大而逐渐减小,所
以希望随着,}的增大,扛与之间的偏差也能逐
渐减小,为此采用一种加权阈值函数:
r(O+5+通常含有很少的
语音信息,其能量主要由噪声提供.此外,由于独立同
分布的加性高斯白噪声,在经过正交小波变换后,仍然
为独立同分布的高斯自噪声,而且噪声方差保持不变.
因而可根据第1层细节信号的小波系数,采用鲁棒中
值算法来估计噪声的方差,即
6-_C…4)—广
式中,Wm为尺度为1的小波系数;median()为Matlab
中的中值运算命令.
通用阈值具备良好的理论支撑,但其实际的应用
效果并不十分理想,这是因为通用阐值与信号的长度
裙关,当较大时,通用阂值趋向于将所有的小波
系数置零,出现所谓的”过扼杀”小波系数的现象,此
时小波滤波器退化为低通滤波器,从而使去噪后的语
音失去大量清音信息,重构语音失真明显增大.为了
有效地弥补这些缺陷,需要对阈值和阈值函数进行改
进.根据信号的不同特点,利用最大信息熵原理对阈
值的大小和阈值函数中的加权因子进行改进,这样不
仅能够有效去除语音中的噪声,而且还可以更好地保
留语音的清音信息.
3.2最大信息熵原理及阈值函数中调节因子及阈值
大小的选取
3.2.1最大信息熵原理
设离散随机变量盖取值为A的概率为P,其中i
=
1,2,…,N,P>0,?P=l,则随机变量的信息
?
14?《测控技术>>2011年第30卷第l0期
熵定义为
,
日():一?Pi1ogP(bi符号)(5)
最大信息熵原理描述在一定条件下,随机变量满
足何种分布时信息熵取得最大值.已经
,在离散
随机变量的情况下,当为等概率分布时,信息熵达
到最大值.
对噪声语音在m个尺度上进行小波分解,每个尺
度上有几个小波系数,设在尺度上的小波系数矢
量为
IV
.
i_.Wj,
1,Wj,
2,…,
,
)(6)
经过改进加权阈值函数处理后,得到的小波系数矢
量为
=
(奶,.,奶l2,…,奶.)(7)
去噪后语音信号在尺度上的能量定义为
=wjIl.=?I(8)
由小波的正交性,经过阈值函数处理后,语音信号
的总能量为
E=?(9)
信号的能量越大就表明它对系统的影响也就越
大,即贡献越显着,在小波去噪中,则说明对含噪信号
中原始信号恢复的贡献越大.故可将尺度上的小波
能量在小波总能量中的比重作为该层小波对去噪的贡
献,即
p,:等:—.,
根据式(5)信息熵的定义,可以得到小波的信息
熵为
H()=一?PJl~g2PJJ=1
lI
‘—一
log2一
??l??li=1k=1=1k=1
根据式(2)可知,式(11)中m与调节因子?和
阈值A有关,因此H()也与?和A有关,是它们的
函数.
根据最大信息熵原理,求得H()=日(?,A)(约
束条件为一0.5???O.5)取最大值时的?和A,由此
便可确定阈值的大小和加权阈值函数的表达式.
3.2.2二重循环搜索法求解?和A
在实际中要想求得日(?,A)在约束条件下取最大
值时的?和A是比较复杂和繁琐的,因此,需要用一
种切实可行的办法来进行求解.
因一0.5???0.5,故可令?的初始值为一0.5,步
长为0.1,终值为0.5;同样将A的初始值也设为0,终值
则为式(10)的通用阈值,步长为0.001,进行二重循环
搜索法来计算日(?,A)在约束条件下取最大值时的?
和A.通过改变步长的大小可得到更加精确的结果.
3.3仿真结果分析
实验中采用的语音材料为一段在安静的实验室环
境下录制的纯净语音,采样率为8kHz,编码位数为
l6-bit.在Matlab软件中,对原始纯净语音分别加入均
值为0,方差为0.002,0.008,0.05,0.1及1的高斯白
噪声,然后对含噪语音分别进行小波包分解,采用
coif5小波,分解层数为4,最后根据最大信息熵原理,
采用二重循环搜索法确定的调节因子及阈值分别进行
去噪处理.
为了进一步评价本文方法的性能,引入信噪比的
客观评价指标,它反映了信号的感知质量.
为证明本算法的有效性,仿真实验中同时对比了
采用软阈值函数,硬阈值函数时的去噪效果.参见表
1及图1.
表1基于最大信息熵的小波去噪与硬阈值及软阈值去噪比较
..iio—-.1——噌..-一1-
占_——————————————l04
(a)原始语音信号
一
123456×10
(b)原始带噪语音信号
oHH-...._—?l一_.1’_-.-——--_—H.-__.._.-,
11—————————————————
×10
(c)软阀值去噪后语音信号
1
0HH——..._一—————_-.———-1.-.1-_.一1
1———————_——————1o4
(d)硬阀值去噪后语音信号
.-_1..一—-一一叶1—
1——————————————×lo4
(e)本算法去噪后语音信号
图1纯净语音中加入均值为0,方差为0.008的
高斯白噪声时的去噪效果
(下转第17页)
基于PCI总线的多功能可定制数据采集系统?l7?
No.BYTEMode);//设置串墨的工作模式
Sio—
SetRevMode(HANDLEhAECMFC4B,BYTEChannelNo,
REVMODE_STRUCTRevMode);//设置串墨数据接收方式
Sio—SetFrameFormat(HANDLEhAECMFCAB,BYTEChan—
neiNo,FRAMEFORMAT_STRUCTFrameFmt);//设置串口帧
起始符和帧长度
SioSetDataFormat(HANDLEhAECMFC4B,BYTEChannd-
No.DATAFORMAT—STRUCT%OataFmt);//设置串口数据位
传输格式
采集任务配置子模块可灵活设置本次试验的测试
数据类型,软件对1553B总线,422总线,429总线,
AFDX总线,AD,DI以及DO所对应的数据格式进行
解析并整理成为统一的格式,通过界面可以方便选择
测试类型,软件中定制界面如4所示.
图4任务定制界面
根据界面的选择定制本次试验任务,选择范围基
本上包含了所有常用的航空电子总线类型,这是该数
据采集系统多功能的体现之一.用户根据自己的ICD
可以进行ICD定制,采集系统根据ICD规则进行
统一解析,呈现给用户的就是统一的解析结果,用户只
需要如图4所示进行任务定制,即可得到辐关参数的
测试,解析过程对用户来说是透明的.
3.2数据采集显示模块关键技术
数据采集显示模块主要采用了多线程,多视图,双
缓冲,Teechart等关键技术.该模块需要的额外线程
包括采集线程,存储线程,显示线程,监控报警线程.
由于采集任务较多,采集频率大于存储频率,因此存储
线程需要采用双缓冲结构,将采集到的数据先存到内
存缓冲区中,然后再将内存缓冲区的数据存储到本地
磁盘上.监控显示的参数较多,而且某些参数之间呈
现相关性,因此需要采用多视图技术,将视图进行分
割,将具有相关性的参数在同一个视图中进行监控显
示,便于用户进行比较.在曲线监控方面用到了图表
控件Teechart,Teecha~由西班牙Steema开发,功能非
常强大,支持二维三维图表显示,鼠标取值,鼠标缩故,
曲线游动等功能,Teecha~控件显示曲线的界面如图5
所示.
3.3数据分析处理模块关键技术
数据分析处理模块采用的关键技术包括Teechart
曲线绘制,ADO组件访问数据库,Excel服务器数据报
表等.Teechart技术在3.2节已经介绍;Excel服务器
用于将从数据库中读出来的数据进行报表和打印,操
作Excel常用的类包括=~pplication,Workbooks,Work一
(上接第l4页)
由表l数据可以看出:与输入信噪比相比,本算法
的输出信噪比有很大的提高,并且本算法的输出信噪
比要明显高于硬阈值去噪法和软阈值去噪法.本算法
在输入信噪比比较大的情况下,输出信嗓比的改善更
大.这表明基于最大信息熵的小波包阈值去噪算法在
抑制白噪声方面要明显优于硬阈值和软阈值去噪法.
通过图1的对比可以看出,基于最大信息熵的小
波去噪算法,在去噪后的信噪比方面,要明显优于传统
的硬阈值及软阈值去噪,这表明该算法能够很好地抑
制高斯白噪声,提高语音增强效果.
4结束语
阈值的设定和阕值函数的选取直接关系到小波阈
值去噪算法的去噪效果.笔者提出了一种基于最大信
息熵的小波去噪语音增强算法,根据最大信息熵的理
论确定阈值和加权阂值函数中加权因子的大小.仿真
结果表明,该算法能够很好地抑制高斯白噪声,为语音
增强提供了一种新的途径,在实际应用中具有一定的
意义.
参考文献:
[1]胡广书.现代信号处理
[M].北京:清华大学出版
社,2007.
[2]张天瑜.基于最大信息熵的小波图像去噪算法研究[1],
长春工业大学(自然科学舨),2009,30(5).
[3]DonohoL,JohnstonelM.Idealspatialadaptationbywave.
1etshrinkage[J].Biometrika,1994,8l(3):425—455.
[4]邓玉娟.基于小波包的阂值语音去噪算法研究[J].电声
技术,2009,33(9):65—69.
口