【关键词】语音抗噪,实时实现,自适应算法
1 引 言
强噪声背景环境下的通信很有必要进行语音增强。自适应噪声抵消技术(ANC)作为一种主要的语音增强方法长时间来得到了相当的重视和发展。早在1975年,美国斯坦福大学的Widow等人做了个有关模拟机舱噪声问题的实验,证明了自适应噪声抵消技术在噪声背景下提取语音信号的可行性〔1〕。自适应噪声抵消技术和其它语音增强方法相比,突出之处就在于此法不基于任何信号模型,对信号统计特性无特殊要求,故其应用范围相当广泛。
自适应滤波器应用于噪声消除时,需要两路输入信号:主信号和参考信号。由于实际环境中,不可避免地会引入串扰,即主信号中混有待消除的噪声,而参考信号中也混有有用信号。串扰的存在严重影响了自适应消噪效果,主要体现在两个方面:(1)消噪后有用信号也被削弱了;(2)可能造成自适应算法的发散。传统的自适应消噪方法对此未加考虑,而对于实际声场的自适应消噪,研究合乎现实环境的抗交叉串扰自适应消噪系统的模型和算法很有必要。
为得到更好的消噪效果,将自适应滤波与谱相减技术进行了结合,能将有用信号完全提取出来。
近年来,DSP技术飞速发展,其高速运算能力使得数字信号的实时处理成为可能。就我们研究的自适应语音抗噪技术来讲,若按8kHz的采样率,DSP的单指令周期小于50ns,则在每125μs内可执行多达2500条以上的单指令操作,选用合适的自适应算法,即可完全满足要求,实现实时处理。通过分
析并结合自适应消噪算法的研究,在实验仿真成熟的基础上,我们用TMS320C32(DSP)构成了语音处理工作站样机,实现了语音自适应抗噪技术的实时处理。
2 抗交叉串扰自适应滤波技术
2.1 环境模型
合乎实际的环境模型如图1所示,S和N为空间中的点语音源和噪声源,M1和M2分别为用于拾音的主话筒和参考话筒。语音源S经过空间声场传到话筒M1和M2换能为S1(n)、S2(n),空间声场传输函数分别为HSS1(z)、HSS2(z);噪声源N经过空间声场分别传到拾音话筒换能为n1(n)、n2(n),空间声场传输函数分别为Hnn1(z)、Hnn2(z)。有如下关系式:
通常情况下,可以假设,空间中的各个声音在空间中的迭加为线性的,因此拾取的信号p(n)、r(n)与S1(n)、S2(n)、n1(n)及n2(n)的关系可近似如下:
同时由于是同一音源激励产生,n1(n)和n2(n)、S1(n)和S2(n)之间是相关的,且分别有如下的关系:
Hs1s2(z)为M1到M2的声场传输函数,Hn2n1(z)为M2到M1的声场传输函数。
2.2 系统模型
为解决由串扰引起的种种问题,基于以上的实际环境模型,研究了如图2所示的三级抗交叉串扰自适应系统模型。滤波器A具有系统辨识和消除噪声串扰的双重作用,滤波器B、C为相关滤波器,消噪过程表述如下:
(1)在无声阶段:M1和M2拾取的信号为纯噪声信号,此时可将它们用作主信号和参考信号输入滤波器A进行自适应系统辨识,只要所采用的自适应滤波算法性能良好,当阶数大于一定的数值时,系统辨识就会很快收敛,当输出误差小于某个极小门限数值时,即可停止自适应系统辨识过程,所得到的HA(z)可在一定程度上逼近实际的声场传输函数Hn2n1(z)。
(2)在有声阶段:主信号和参考信号均为语音和噪声的混合。在此阶段滤波器A停止自适应辨识过程,只利用无声阶段获得的HA(z)进行滤波。滤波器B、C始终在自适应滤波。输出为:
上式中,由于M1和M2在空间的位置或多或少有差异,所以一般有:
理论上,e1(n)将主要含有与有用信号S1(n)相关的成分,是S1(n)的一个失真变形信号,所有的噪声成分都被滤除。
将p(n)、e1(n)分别作为主信号和参考信号输入滤波器B进行自适应滤波。当滤波过程达到收敛后,其输出e2(n)为去掉了与e1(n)相关的成分后的剩余,主要为原始含噪语音中的噪声信号。最后将p(n)、e2(n)分别作为主信号、参考信号输入到滤波器
C,自适应滤波达到收敛后,e3(n)主要为原始含噪语音的有用信号,所含的噪声将比p(n)大大减少,而且保持一定的保真度和可懂度,此即达到了消噪的目的。
按此模型,即使主信道和参考信道间的串扰很严重,由于利用系统辨识得到了声场传输函数的知识,而且利用同一声源在空间不同点激励的信号具有相关性,不同声源激励的信号不相关的特点,完全有可能用自适应的方法对它们进行预测,消除大部分噪声。图3给出了计算机仿真结果,自适应算法采取带平方根的Givens-Lattice算法。(a)为原始含噪语音,从图中可看出有用信号完全淹没在噪声中。(b)为三级抗交叉串扰处理后的消噪结果。(c)为原始含噪声语音中的纯净语音信号。比较图(b)和(c),其波形几乎完全一致,证明了模型和算法的正确性和可行性。
3 自适应抗噪与谱相减的结合
将自适应抗噪处理的结果再经过频谱相减处 理,能得到更好的消噪效果。图4所示为采集的实际
数据在MATLAB集成环境下的仿真结果,从图中对比可知这种技术将噪声完全消去了。这里,噪声为话筒拾取的来源于收音机失谐时的纯噪声,话音为“抗背景干扰的自适应滤波系统的设计与实现”的人的讲话声。自适应抗噪选用的是LMS算法,谱相减采用的是改进的频谱相减算法。由于LMS算法的运算量小,谱相减是数据块处理,因此用DSP实时实现是可行的。
4 实时实现
在算法研究成熟的基础上,利用DSP实现了语音抗噪的实时处理。基于语音消噪处理算法的特点和运算量,在设计中采用由北京高科数字处理公司开发的GK-TMS320C32B型开发/高速处理开发板,并选用与TMS320C3X串行口直接相连而不需要外围电路的专用14位音频A/D、D/A转换器TLC32044CN,开发了两路无相差信号采集接口板(AIC),形成了语音处理工作站样机,其基本框架如图5所示。DSP按样点处理,对信号采样率为8kHz,整个系统的延迟时间为125μs,对信噪比的改善达
到了15dB,且对语音信号几乎无损伤。
5 结束语
以TLC32044CN和TMS320C32为核心的语音处理工作站,为语音处理提供了一个工作平台。该技术前不久通过了信息产业部军工预研局的鉴定,获得了一致的好评。该样机已接近实用阶段,具有开发应用的前景。