语音信号处理、语音信号分析
1、语音信号倒谱??有什么用呢?它和 频谱有什么区别呢?2、线性预测分析是预测什么呢?准确吗?语音信号的倒谱分析就是求取语音倒谱特征参数的过 程,它可以通过同态处理来实现。同态信号处理也称为同态滤波,它实现了将卷积关系 变换为求和关系的分离处理,即解卷。对语音信号进行解卷,可将语音信号的声门激励信息 及声道响应信息分离开来,从而求得声道共振特征和 基音周期,用于语音编码、合成、识别等。对语音信号进
1、语音信号倒谱??有什么用呢?它和 频谱有什么区别呢?
2、线性预测分析是预测什么呢?准确吗?
语音信号的倒谱分析就是求取语音倒谱特征参数的过 程,它可以通过同态处理来实现。
同态信号处理也称为同态滤波,它实现了将卷积关系 变换为求和关系的分离处理,即解卷。
对语音信号进行解卷,可将语音信号的声门激励信息 及声道响应信息分离开来,从而求得声道共振特征和 基音周期,用于语音编码、合成、识别等。
对语音信号进行解卷,求取倒谱特征参数的方法有两 种,一种是线性预测分析,一种是同态分析处理。
日常生活中遇到的许多信号,它们并不是加性信号(即 组成各分量按加法原则组合起来)而是乘积性信号或卷 积性信号,如语音信号、图像信号、通信中的衰落信号、 调制信号等。
些信号要用非线性系统来处理 而同态信号处理就是将非线性问题转化为线性问题的处 理方法。 按被处理的信号来分类,大体分为乘积同态处理和卷积 同态处理两种。 由于语音信号可视为声门激励信号和声道冲激响应的卷 积,所以这里仅讨论卷积同态信号处理。
同态信号处理的基本原理 1)不同信号的处理方法 加性信号:线性关系、叠加原理——处理方法成熟 乘性信号:加性信号 卷积信号:非线性关系、不能用叠加原理——处理困难 2)卷积同态系统*表示离散时间卷积运算
同态信号处理的基本原理
任何同态系统都可以表示为三个子系统的级联
同态信号处理的基本原理
同态信号处理的基本原理
复倒谱和倒谱
语音信号两个卷积分量的复倒谱
语音信号可看做是声门激励信号 和声道冲激响应两信号的卷积, 分别讨论这两个信号的复倒谱的 性质。
复倒谱和倒谱
相位卷绕的产生是由于相位的多值性问题,对 复倒谱的影响: 它会使后面由复倒谱恢复语音等运算存在不确定 性而产生错误。 对策: 改进算法,避开相位求和!
微分法
MEL频率倒谱参数(MFCC)
与普通实际频率倒谱分析不同,MFCC(Mel-Frequency Cepstral Coefficents,简称MFCC)的分析着眼于人耳的 听觉特性,因为,人耳所听到的声音的高低与声音的频 率并不成线性正比关系,而用Mel频率尺度则更符合人 耳的听觉特性。所谓Mel频率尺度,它的值大体上对应 于实际频率的对数分布关系。Mel频率与实际频率的具 体关系可表示为:
取每个三角形的滤波器频率带宽内所有信号幅度加 权和作为某个带通滤波器的输出——对所有滤波器输 出作对数运算——做离散余弦变换。(具体见P71)
语音信号的吸纳性预测分析
1947年维纳首次提出了线性预测
1967年板仓把线性预测技术应用到了语音分析和合成中
目前,线性预测普遍应用于语音信号处理的各个方面 线性预测分析的基本思想是:由于语音样点之间存在相 关性,所以可以用过去的样点值来预测现在或未来的样 点值,即一个语音的抽样能够用过去若干个语音抽样或 它们的线性组合来逼近。通过使实际语音抽样和线性预 测抽样之间的误差在某个准则下达到最小值来决定唯一 的一组预测系数。 而这组预测系数就反映了语音信号的特性,可以 作为语音信号特征参数用于语音识别、语音合成等。
线性预测分析要解决的问题是:给定语音序列 (显然,鉴于语音信号的时变特性,LPC分析必须按 帧进行),使预测误差在某个准则下最小,求预测 系数的最佳估值ai,这个准则通常采用最小均方误 差准则。
说明: (1)求解滤波器系数 ai和增益常数G的过程称为 语音信号的线性预测分析 (2)鉴于语音信号的时变特性,预测系数的估计必 须在一段语音信号中进行,即分帧进行 (3)对于鼻音和摩擦音,要求声道传递函数既要有 极点也要有零点,即采用零极模型
线性预测方程组的求解
更多推荐
所有评论(0)