语音处理的线性预测

admin • 2022-12-11 19:59 • 人工智能

线性预测是几乎所有现代语音编码算法的基础
– 手机
– 网络电话 (VOIP)
– 军事通讯
线性预测假设语音信号的每个样本都可以从 P 个先前样本的加权和中预测出来，利用平稳性假设产生的冗余，线性预测允许数百个样本的语音帧仅由 10-15 个“预测系数”(a1 … aP) 表示。

对于一般的数字滤波器例如FIR滤波器
• 只有前向路径
• 固有稳定
• z 平面中没有极点（只有零点）

线性预测分析：
特定样本 e[k] 的预测误差为
对两边进行 Z 变换，能得到
因此，预测误差滤波器传递函数是，同时也被称为全零点过滤器

计算预测系数

计算线性预测系数以最小化语音数据帧上的平方和“预测误差”（“残差信号”），均方误差 (MSE) 。这具有“白化”误差信号的效果（即展平其频谱，

通过找到解决方案来最小化 Ep，也就是最小均方误差 (MMSE)，这能得到一组 p 个联立方程，也称为正规方程 normal equations

不同范围的求和会产生
–自相关法（Durban’s algorithm）autocorrelation method
–协方差法 covariance method

	自相关法	协方差法
过滤顺序	10-15	10-15
Windowing	有	无
稳定性	有	无
窗口大小	25 msec	5-10 msec
预算	+	+++
反射系数	有	无

线性预测
从信号到预测误差序列的滤波器传递函数是全零点滤波器
从预测误差序列到信号的滤波器传递函数是全极点滤波器

线性预测合成
线性预测滤波器可以配置为全极点数字滤波器，以误差信号作为输入

LP 滤波器可用于分析和合成
– 分析
• 输入 = 信号
• 输出 1 = 预测系数
• 输出 2 = “残留”误差
– 合成
• 输入 1 = 预测系数
• 输入 2 = “残留”误差
• 输出 = 重构信号

残差+预测系数的数据率可以远低于信号的数据率，这使得线性预测特别适用于对语音信号进行编码

在语音分析-再合成中
– LP 滤波器对声道引起的频谱整形进行建模
– 误差序列对源激励进行建模

– 分析模型假设脉冲/白噪声激励（因此 LP 滤波器也捕获由声门源引起的频谱整形）
– 合成模型（全极点模型）忽略任何零点（例如鼻侧支和声门下的路径）

所以，线性预测的应用
• 音调提取
• 共振峰分析
• 语音合成
• 自动语音识别
• 线性预测编码 (LPC)

全球移动通信系统（GSM）Global System for Mobile communications 的基本操作原理：
– CELP（ Code-Excited LPC）
– 8 kHz 采样率
– 20 毫秒帧
– 每帧 8 个短期预测系数
– 然后每个帧进一步分为四个 5 毫秒子帧
– 对于编码器为编解码器的长期预测器找到延迟和增益的每个子帧——短期和长期滤波后的残余信号为每个子帧量化

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

线性预测

二维码

Java知识点–IO流（下）

< <上一篇

3D立体匹配入门 – 视差计算

下一篇>>

搜索内容

语音处理的线性预测

最新文章

分类

标签云