数字语音处理理论与应用 版权信息
- ISBN:9787121275906
- 条形码:9787121275906 ; 978-7-121-27590-6
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>>
数字语音处理理论与应用 本书特色
本书是作者继1978年出版的经典教材《语音信号的数字处理》之后的又一著作,全书除有简练精辟的基础知识介绍外,系统讲解了近30年来语音信号处理的新理论、新方法和在应用上的新进展。全书共14章,分四部分:**部分介绍语音信号处理基础知识,主要包括数字信号处理基础、语音产生机理、(人的)听觉和听感知机理,以及声道中的声传播原理;第二部分介绍语音信号的时、频域表示和分析;第三部分介绍语音参数估计方法;第四部分介绍语音信号处理的应用,主要包括语音编码、语音和音频信号的频域编辑、语音合成、语音识别及自然语言理解。
数字语音处理理论与应用 内容简介
本书是作者继1978年出版的经典教材《语音信号的数字处理》之后的又一著作,全书除有简练精辟的基础知识介绍外,系统讲解了近30年来语音信号处理的新理论、新方法和在应用上的新进展。全书共14章,分四部分:**部分介绍语音信号处理基础知识,主要包括数字信号处理基础、语音产生机理、(人的)听觉和听感知机理,以及声道中的声传播原理;第二部分介绍语音信号的时、频域表示和分析;第三部分介绍语音参数估计方法;第四部分介绍语音信号处理的应用,主要包括语音编码、语音和音频信号的频域编辑、语音合成、语音识别及自然语言理解。
数字语音处理理论与应用 目录
第1章 数字语音处理介绍 11.1 语音信号 21.2 语音堆 51.3 数字语音处理的应用 61.3.1 语音编码 61.3.2 文语转换合成 71.3.3 语音识别和其他模式匹配问题 71.3.4 其他语音应用 81.4 参考文献评论 91.5 小结 10第2章 数字信号处理基础回顾 112.1 引言 112.2 离散时间信号与系统 112.3 信号与系统的变换表示 132.3.1 连续时间傅里叶变换 142.3.2 z变换 142.3.3 离散时间傅里叶变换 162.3.4 离散傅里叶变换 172.3.5 dtft的采样 182.3.6 dft的性质 192.4 数字滤波器基础 202.4.1 fir系统 202.4.2 fir滤波器设计方法 212.4.3 fir滤波器实现 232.4.4 iir系统 232.4.5 iir滤波器设计方法 232.4.6 iir系统的实现 242.4.7 关于fir和iir滤波器设计方法的说明 272.5 采样 272.5.1 采样原理 272.5.2 语音和音频波形的采样率 282.5.3 改变采样信号的采样率 292.5.4 抽取 292.5.5 插值 322.5.6 非整数采样率变化 332.5.7 fir滤波器的优点 342.6 小结 34习题 34第3章 人类语音产生基础 423.1 引言 423.2 语音产生过程 423.2.1 语音产生机理 423.2.2 语音特征与语音波形 463.2.3 语音生成的声学理论 493.3 语音的短时傅里叶表示 503.4 声音语音学 533.4.1 元音 553.4.2 双元音 603.4.3 声音的辨音特质 603.4.4 半元音 613.4.5 鼻音 623.4.6 清擦声 643.4.7 浊擦音 653.4.8 浊塞音 673.4.9 清塞音 673.4.10 破擦声和耳语音 693.5 美式英语音素的辨音特质 703.6 小结 70习题 71第4章 听觉、听感知模型和语音感知 804.1 引言 804.2 语言链 804.3 解剖学和耳的功能 824.3.1 基底膜机理 844.3.2 临界频带 854.4 声音的感知 854.4.1 声音的强度 874.4.2 人的听觉范围 874.4.3 响度级 904.4.4 响度 914.4.5 音高 914.4.6 掩蔽效应——音调 924.4.7 掩蔽效应——噪声 934.4.8 时域掩蔽效应 944.4.9 语音编码中的掩蔽效应 954.4.10 参数鉴别——jnd 954.5 听感知模型 964.5.1 感知线性预测 964.5.2 seneff听感知模型 974.5.3 lyon听感知模型 994.5.4 整体区间直方图方法 1004.5.5 听感知模型小结 1014.6 人类语音感知实验 1014.6.1 噪声中的声音感知 1024.6.2 噪声中的语音感知 1034.7 语音质量和可懂度测量 1044.7.1 主观测试 1054.7.2 语音质量的客观测量 1064.8 小结 107习题 107第5章 声道中的声音传输 1095.1 语音产生的声学原理 1095.1.1 声音传播 1095.1.2 例子:均匀无损声管 1105.1.3 声道中损耗的影响 1145.1.4 嘴唇的辐射影响 1175.1.5 元音的声道传输函数 1205.1.6 鼻腔耦合的影响 1235.1.7 声道中声音的激励 1235.1.8 基于声学理论的模型 1275.2 无损声管模型 1285.2.1 级联无损声管中的波形传播 1285.2.2 边界条件 1305.2.3 与数字滤波器的关系 1345.2.4 无损声管模型的传输函数 1375.3 采样语音信号的数字模型 1415.3.1 声道建模 1415.3.2 辐射模型 1435.3.3 激励模型 1445.3.4 完整模型 1445.4 小结 146习题 146第6章 语音信号处理的时域方法 1536.1 引言 1536.2 语音的短时分析 1546.2.1 短时分析的通用框架 1566.2.2 短时分析中的滤波和采样 1566.3 短时能量和短时幅度 1596.3.1 基于短时能量的自动增益控制 1606.3.2 短时幅度 1626.4 短时过零率 1636.5 短时自相关函数 1696.6 修正短时自相关函数 1736.7 短时平均幅度差分函数 1766.8 小结 177习题 177第7章 频域表示 1837.1 引言 1837.2 离散时间傅里叶分析 1847.3 短时傅里叶分析 1867.3.1 dtft解释 1877.3.2 dft实现 1887.3.3 加窗对分辨率的影响 1887.3.4 关于短时自相关函数 1937.3.5 线性滤波解释 1937.3.6 时域和频域中 的采样率 1977.4 频谱显示 1997.5 合成的重叠相加法 2067.5.1 精确重建的条件 2067.5.2 合成窗的应用 2117.6 合成的滤波器组求和方法 2127.7 时间抽取滤波器组 2177.7.1 通用fbs抽取系统 2187.7.2 *大抽取滤波器组 2217.8 双通道滤波器组 2227.8.1 正交镜像滤波器组 2237.8.2 qmf滤波器组的多相结构 2257.8.3 共轭正交滤波器 2257.8.4 树形结构滤波器组 2267.9 使用fft实现fbs方法 2287.9.1 fft分析技术 2287.9.2 fft合成技术 2307.10 ola再论 2327.11 修正的stft 2337.11.1 乘性修正 2337.11.2 加性修正 2367.11.3 时间标度修正:相位声码器 2377.12 小结 242习题 242第8章 倒谱和同态语音处理 2558.1 简介 2558.2 卷积同态系统 2568.2.1 dtft表示 2578.2.2 z变换表示 2608.2.3 复倒谱的性质 2608.2.4 复倒谱分析实例 2628.2.5 *小和*大相位信号 2648.3 语音模型的同态分析 2658.3.1 浊音模型的同态分析 2668.3.2 清音模型的同态分析 2718.4 计算语音的短时倒谱和复倒谱 2738.4.1 基于离散傅里叶变换的计算 2738.4.2 基于z变换的计算 2768.4.3 *小相位和*大相位信号的递归计算 2788.5 自然语音的同态滤波 2798.5.1 语音短时倒谱分析模型 2808.5.2 使用多项式根的短时分析实例 2818.5.3 应用dft的浊音分析 2828.5.4 *小相位分析 2868.5.5 应用dft的清音分析 2878.5.6 短时倒谱分析小结 2898.6 全极点模型的倒谱分析 2908.7 倒谱距离度量 2918.7.1 线性滤波补偿 2928.7.2 加权倒谱距离度量 2928.7.3 群时延频谱 2938.7.4 mel频率倒谱系数 2948.7.5 动态倒谱特征 2968.8 小结 296习题 296第9章 语音信号的线性预测分析 3019.1 引言 3019.2 线性预测分析的基本原理 3029.2.1 线性预测分析方程的基本公式 3049.2.2 自相关法 3059.2.3 协方差法 3079.2.4 小结 3089.3 模型增益的计算 3099.4 线性预测分析的频域解释 3119.4.1 线性预测短时频谱分析 3119.4.2 均方预测误差的频域解释 3139.4.3 模型阶数p的作用 3169.4.4 线性预测语谱图 3189.4.5 与其他谱分析方法的对比 3209.4.6 选择性线性预测 3219.5 lpc方程组的解 3229.5.1 cholesky分解 3229.5.2 levinson-durbin算法 3259.5.3 格型公式及其解 3289.5.4 计算需求比较 3349.6 预测误差信号 3359.6.1 归一化均方误差的其他表示法 3389.6.2 lpc参数值的实验评估 3399.6.3 归一化误差随帧位置的变化 3429.7 lpc多项式a(z)的一些性质 3449.7.1 预测误差滤波器的*小相位性质 3449.7.2 parcor系数和lpc多项式的稳定性 3449.7.3 *佳lp模型根的位置 3459.8 线性预测分析与无损声管模型的关系 3489.9 lp参数的替代表示 3519.9.1 预测误差多项式的根 3519.9.2 全极点系统 的冲激响应 3529.9.3 冲激响应的自相关 3529.9.4 倒谱 3529.9.5 预测器多项式的自相关系数 3539.9.6 parcor系数 3539.9.7 对数面积比系数
展开全部
数字语音处理理论与应用 作者简介
Lawrence R. Rabiner: 美国工程院和美国科学院院士,美国声学学会、IEEE、贝尔实验室、AT&T会士,以及Eta Kappa Nu、Sigma Xi、Tau Beta Pi等荣誉学会会员。曾担任美国声学学会副主席、IEEE Trans、ASSP主编和IEEE Proceedings编委。主要研究方向包括通信、控制与信号处理、数字信号处理、数字语音处理、多媒体通信、多模态处理、Rabiner教授于2002年从AT&T退休,随后担任罗格斯大学和加州大学圣巴巴拉分校教授,及罗格斯大学先进信息处理中心副主任。
刘加,清华大学教授,主要从事数字信号处理与数字语音信号处理的教学与研究工作,发表论文多篇,在教学与研究方面获得多面荣誉。主要研究方向为信号与信号处理,语音通信等。