语音处理的线性预测

线性预测是几乎所有现代语音编码算法的基础
– 手机
– 网络电话 (VOIP)
– 军事通讯
线性预测假设语音信号的每个样本都可以从 P 个先前样本的加权和中预测出来,利用平稳性假设产生的冗余,线性预测允许数百个样本的语音帧仅由 10-15 个“预测系数”(a1 … aP) 表示。

对于一般的数字滤波器例如FIR滤波器
• 只有前向路径
• 固有稳定
• z 平面中没有极点(只有零点)

线性预测分析:
特定样本 e[k] 的预测误差为在这里插入图片描述
对两边进行 Z 变换,能得到在这里插入图片描述
因此,预测误差滤波器传递函数是在这里插入图片描述,同时也被称为全零点过滤器

计算预测系数

计算线性预测系数以最小化语音数据帧上的平方和“预测误差”(“残差信号”),均方误差 (MSE) 。这具有“白化”误差信号的效果(即展平其频谱,
在这里插入图片描述
通过找到解决方案来最小化 Ep,也就是最小均方误差 (MMSE),这能得到一组 p 个联立方程,也称为正规方程 normal equations
在这里插入图片描述
不同范围的求和会产生
自相关法(Durban’s algorithm)autocorrelation method
协方差法 covariance method

自相关法 协方差法
过滤顺序 10-15 10-15
Windowing
稳定性
窗口大小 25 msec 5-10 msec
预算 + +++
反射系数

线性预测
信号到预测误差序列的滤波器传递函数是全零点滤波器在这里插入图片描述
预测误差序列到信号的滤波器传递函数是全极点滤波器
在这里插入图片描述

线性预测合成
线性预测滤波器可以配置为全极点数字滤波器,以误差信号作为输入

LP 滤波器可用于分析和合成
– 分析
• 输入 = 信号
• 输出 1 = 预测系数
• 输出 2 = “残留”误差
– 合成
• 输入 1 = 预测系数
• 输入 2 = “残留”误差
• 输出 = 重构信号

残差+预测系数的数据率可以远低于信号的数据率,这使得线性预测特别适用于对语音信号进行编码

在语音分析-再合成中
– LP 滤波器对声道引起的频谱整形进行建模
– 误差序列对源激励进行建模

分析模型假设脉冲/白噪声激励(因此 LP 滤波器也捕获由声门源引起的频谱整形)
合成模型(全极点模型)忽略任何零点(例如鼻侧支和声门下的路径)

所以,线性预测的应用
• 音调提取
• 共振峰分析
• 语音合成
• 自动语音识别
• 线性预测编码 (LPC)

全球移动通信系统(GSM)Global System for Mobile communications 的基本操作原理:
CELP( Code-Excited LPC)
– 8 kHz 采样率
– 20 毫秒帧
– 每帧 8 个短期预测系数
– 然后每个帧进一步分为四个 5 毫秒子帧
– 对于编码器为编解码器的长期预测器找到延迟和增益的每个子帧——短期和长期滤波后的残余信号为每个子帧量化

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>