语音信号噪音处理及浊音、清音的分辨对智能机器人人机语音交互系统是非常重要的。本文采用MATLAB软件平台设计了巴特沃斯FIR数字滤波器,进行简单的语音信号去噪音滤波处理。由于原始语音信号的时域波形图与频谱图变化小,分析起来有一定的困难,为方便波形分析,需要对原始语音信号进行4千赫兹和8千赫兹重抽样调查,通过短时平均过零率与短时自相关函数法对语音信号进行清、浊音的辨别和基音周期提取。通过分析结果显示,基于切比雪夫窗函数设计的滤波器对语音信号过滤效果有非常大的帮助。
关键词:滤波器,MATLAB,语音信号,重采样
语言是人与人工智能进行交流的基础。为获得清晰的语言信息,用数字信号处理技术对语音信号进行处理非常重要。处理语音的基本理论以及处理算法研究主要在两个方面:①从语音的产生和语音感知进行研究;②为获得有效的语音信号对语音进行去噪声处理[1-4]。
语音处理技术是多学科、多领域相结合的高新技术,其中包括数字信号处理、语言学、语音学、模式识别等,现已成为人工智能实现人机对话的重要基础[3-5]。
本文利用MATLAB设计了FIR数字滤波器进行语音信号去噪处理,主要采用切比雪夫窗函数设计FIR数字滤波器。为便于分析,将原始语音信号进行4千赫兹和8千赫兹重采样,然后根据滤波的性能指标对含有噪音的语音信号进行滤波处理,最后将滤波前后的时域波形与频谱波形进行了比较。
1 数字滤波器设计
数字滤波器(DF,即Digital Filter)分为两大类:经典滤波器和现代滤波器,其中输入端的信号中不仅有可用的频率成分,还有无用的频率成分,在经典滤波器中占有不同的频率宽带,通过一个合适的选频滤波器滤除干扰,就可得到纯净信号,达到滤波目的[6]。数字滤波器功能是指把一系列输入信号通过一定的运算变换成输出信号。
在设计数字滤波器时,采用的运算处理方法不同,决定了运用滤波器的结构也不同。FIR数字滤波器基本网络结构主要有直接型、级联型、线性型和频率采样型[7]几种,本文簡要介绍前两种结构的系统函数及结构。
2 语音信号处理方案
人在说话时与环境以及说话人的状态有关,人机交互更是如此,在相对安静的环境里录制一段时间为10秒的语音信号作为本文待处理信号,图3为处理流程。
(1)利用GoldWave录音软件录制,保存格式为.wav后缀,利用MATLAB软件中的wavread()函数读取录制好的语音信号,并绘制出该语音信号的时域与频谱波形图[4]。
(2)MATLAB给信号加噪声的方法很多,如可以添加白噪声、随机噪声等。本文直接通过MATLAB软件给原始信号叠加指定的噪音,该噪声为幅值Az=0.02,噪声频率为ωz=10的正弦信号噪声,即Z=0.02*sin(10*n)。模拟原始语音信号被噪声干扰,然后绘制出叠加噪音后的时域与频谱波形图。
(3)滤波性能指标为ωp=0.6*pi,ωs=0.75*pi,RP=1,As=30,T=1,MATLAB中滤波器设计采用切比雪夫窗函数。采用FIR数字滤波器,对叠加有噪音的语音信号进行滤波处理,然后绘制出含有噪声的语音信号频谱。
(4)根据MATLAB所绘制的波形图,分析语音信号滤波前后的变化。
3 实验结果与分析
(1)图4为原始语音信号的时域、频谱图。由于原始信号的频谱图在0~0.2千赫兹和1.8~2千赫兹范围内波动较小,为便于分析,将原始语音信号进行4KHz和8KHz的重采样处理,绘制出如图5、图6的时域波形图与频谱图。
(2)图7为噪音信号时域波形与频谱图,该噪音在频率为8kHz和1.2kHz时的噪音最明显。根据滤波性能指标ωp=0.6*pi,ωs=0.75*pi,RP=1,As=30,T=1,巴特沃斯滤波器滤除含有加噪音的信号。图8为加噪音滤波后时域与频谱图,从图中可以看出,该滤波器将频率为8kHz和1.2kHz时的噪音成功滤除了,这表明该滤波器满足滤波性能要求。
(3)在进行语音辨别时,需要对清音、浊音及噪音进行区别。由于语音属于非平稳的宽带信号,利用短时平均过零率来辨别清音与浊音,根据过零次数的高低来辨别清、浊音,如图9所示。过零次数最高的语音信号在帧数为1 480帧左右时达到最高,为清音。过零次数最高时,对应语音信号波形中幅度变化最剧烈处。
(4)为便于语音系统诊断与识别说话人,提取语音基音至关重要。语音基音检测技术有时域自相关函数法、频域倒谱法及将两者相结合的小波变换分析法。考虑到滤波器的性能指标,在截取原始语音信号的基音周期时采用短时自相关函数法,该方法在检测时域波形周期性与同步性上效果好且相对容易。
4 结语
本文设计的巴特沃斯FIR数字滤波器具有较好的滤除效果,在时域波形上,滤波后的波形与原始语音信号波形变化较小,从两者的频谱图上可较明显看出滤波去噪音前后的变化。通过短时过零率能分辨出清音、浊音。短时自相关函数可从信号本身检测到基音周期。
參考文献:
[1] 赵力.语音信号处理[M].北京:机械工业出版社,2003.
[2] 梁晓辉,周权.语音信号处理方法的可靠性研究[J].电声技术,2010,34(4):58-62.
[3] 宋毅郡,朱艳萍,宋耀良.基于分数阶滤波器的ADPCM预测误差信号处理[J].电声技术,2010,34(5):52-55.
[4] 付大丽,党幼云.数字滤波器在语音信号处理中的应用[J].电声技术,2012,36(8):62-72.
[5] 王淑娇.数字滤波器的设计与参数的选择[J].科技资讯,2011,35(12):32-33.
[6] 文德仲.浅析数字滤波器原理及其设计过程[J].技术与应用,2016:161-162.
[7] 王兵锋.FIR数字滤波器设计与仿真研究[D].哈尔滨:哈尔滨理工大学,2009.
推荐阅读:天津理工大学学报期刊论文投稿须知
《天津理工大学学报》(双月刊)曾用刊名:天津理工学院学报,1984年创刊,以追求科技创新、展示科技成果,促进学术交流、推动社会科技进步,发现培养新人为宗旨。刊发有关自然科学与工程技术各学科领域、国家自然科学基金、国家863项目、国家973项目,省不及各类基金自主的科研项目、理论研究、应用科技成果、实验研究的高水平科技论文。
论文指导 >
SCI期刊推荐 >
论文常见问题 >
SCI常见问题 >