编辑推荐
适读人群 :从事语音信号处理的科研工程技术人员,计算机和通信与信息系统等学科相关专业的高年级本、专科学生和研究生 《语音信号处理(C++版)》大的特点是在介绍基本理论和基本算法的基础上,给出部分C++程序实现,使学习人员可以边学习理论边实践。
《语音信号处理(C++版)》还可以配套《语音信号处理实验教程》(ISBN 978-7-111-53071-8)使用,以方便教师根据不同的学生层次和要求来组织实验教学,加深学生对知识的理解和掌握。
内容简介
《语音信号处理(C++版)》介绍了语音信号处理的基础、原理、方法和应用,并且给出一些语音信号处理关键算法的C++函数。全书共分12章。第1章介绍了语音信号处理的发展历程和相关研究方向;第2~4章介绍了语音信号处理的一些基础理论、方法和参数;第5~12章按语音信号处理的研究方向,分别介绍了语音增强、说话人识别、语音识别、语音信号情感处理、语音合成与转换、声源定位、语音隐藏和语音编码的基础理论和算法原理。在附录中,介绍了本书涉及的C++类库及引入的函数库,并且以基于Visual Studio的语音录放程序为例,详细介绍了基于MFC的语音处理框架及程序实现。
《语音信号处理(C++版)》可作为计算机和通信与信息系统等学科相关专业的高年级本、专科学生和研究生的教材用书或教学参考用书,也可作为从事语音信号处理的科研工程技术人员的辅助读物和参考用书。
目录
目录
前言
第1章绪论
1.1语音信号的发展历程
1.2语音信号处理的研究方向
1.3本书结构第2章语音信号处理的基础知识
2.1语音的产生与感知
2.2语音产生的数学模型
2.3语音的常用参数
2.4语音信号的数字化
2.5语音信号的表征
2.6思考与复习题第3章语音信号分析方法
3.1概述
3.2语音信号预处理
3.3语音信号的时域分析[C]
3.4语音信号的频域分析
3.5语音信号的倒谱分析
3.6语音信号的线性预测分析
3.7思考与复习题第4章语音信号特征提取技术
4.1概述
4.2端点检测[C]
4.3基音周期估计[C]
4.4共振峰估计[C]
4.5思考与复习题第5章语音增强
5.1概述
5.2基础知识
5.3谱减法
5.4维纳滤波法
5.5自适应滤波器法
5.6基于听觉掩蔽效应的语音增强方法
5.7思考与复习题第6章说话人识别
6.1概述
6.2说话人识别原理及系统结构
6.3应用VQ的说话人识别系统
6.4应用GMM的说话人识别系统
6.5尚需进一步探索的研究课题
6.6思考与复习题第7章语音识别
7.1概述
7.2语音识别原理与系统构成
7.3基于动态时间规整的语音识别系统
7.4基于隐马尔可夫模型的语音识别系统
7.5性能评测
7.6系统总结
7.7思考与复习题第8章语音信号情感处理
8.1概述
8.2情感理论与情感诱发实验
8.3情感的声学特征分析
8.4实用语音情感的识别算法研究
8.5应用与展望
8.6思考与复习题第9章语音合成与转换
9.1概述
9.2帧合成技术
9.3经典语音合成算法
9.4语音信号的变速和变调[C]
9.5文语转换系统
9.6语音转换及其研究方向
9.7思考与复习题第10章声源定位
10.1概述
10.2双耳听觉定位原理及方法
10.3传声器阵列模型
10.4房间回响模型[C]
10.5基于传声器阵列的声源定位方法
10.6总结与展望
10.7思考与复习题第11章语音隐藏
11.1概述
11.2信息隐藏基础
11.3语音信息隐藏算法
11.4常用评价指标
11.5总结与展望
11.6思考与复习题第12章语音编码
12.1概述
12.2理论依据
12.3主要性能指标
12.4波形编码
12.5参数编码
12.6语音信号的混合编码
12.7研究展望
12.8思考与复习题附录附录AMFC类模板及引入的函数库说明
A.1std::vector简介
A.2std::complex简介
A.3FFTW函数库简介附录B基于MFC的语音录放原理与程序实现
B.1MFC消息机制
B.2基于MFC的语音录放原理
B.3基于MFC的语音录放程序实现附录C书中涉及的C++函数说明参考文献
前言/序言
前言
语音信号处理是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性学科,与心理学、生理学、计算机科学、通信与信息科学以及模式识别和人工智能等学科都有着非常密切的关系。该学科始终与信息科学中最活跃的前沿学科保持密切的联系,并且一直是数字信号处理技术发展的重要推动力量,从而能够长期地、深深地吸引广大科研工作者不断地进行研究和探讨。
《语音信号处理(C++版)》较全面地反映了现代语音信号处理的主要内容和发展方向,主要面向信号与信息处理、电路与系统、通信与电子工程、模式识别与人工智能、计算机信息处理等学科有关专业的高年级本科生和研究生,也可以作为从事语音信号处理这一领域科研工作的技术人员参考书。因此,《语音信号处理(C++版)》在内容上强调基本概念和基本理论方法的掌握,并突出各部分的相互联系。此外,考虑到语音信号处理的实用性很强,《语音信号处理(C++版)》在介绍基本理论和基本算法的基础上,给出部分C++程序实现,使学习人员可以边学习理论边实践,有助于知识的理解和记忆。
《语音信号处理(C++版)》的参考学时为本科生32学时、研究生40学时,可以根据不同的教学要求对内容进行适当取舍,灵活安排授课学时数。全书共分为12章,具体内容如下:
第1章简要介绍了语音信号处理的发展历程和当前的主要研究方法,以及本书的章节安排情况。
第2章介绍了语音信号处理的基础知识,包括语音的发音和感知机理、语音信号的数学模型、语音信号的基本参数以及语音的基本表征方法等。
第3章介绍了语音信号的预处理方法(包括分帧与加窗、趋势项和直流量的消除、预加重和去加重)以及4种语音信号的基本分析方法,包括时域分析、频域分析、倒谱分析和线性预测分析。
第4章介绍3种语音信号的特征提取技术,包括端点检测、基音周期估计和共振峰估计。其中,端点检测算法包括双门限法、自相关法、谱熵法、比例法和谱距离法;基音周期估计算法包括信号预处理、自相关法、平均幅度差函数法、倒谱法、简化逆滤波法以及后处理法;共振峰估计算法包括倒谱法和线性预测法。
第5章介绍了语音增强的基本原理和典型算法。首先介绍了语音和噪声特性、人耳的声音感知特性和语音质量的评价标准,然后依次介绍4种语音增强算法:谱减法、维纳滤波法、自适应滤波器法和基于听觉掩蔽效应的语音增强方法。
第6章介绍了说话人识别算法。首先介绍了说话人识别的原理及系统结构,然后介绍了两种典型的说话人识别系统,分别是基于VQ的说话人识别系统和基于GMM的说话人识别系统。最后介绍了说话人识别的研究难点。
第7章介绍了语音识别算法。首先介绍了语音识别基本原理与系统构成,然后介绍了基于动态时间规整的语音识别系统和基于隐马尔可夫模型的语音识别系统,最后介绍了算法的评测方法。
第8章介绍了语音信号中的情感信息处理的基本原理。首先介绍了情感理论和语音数据库的建立方法,然后介绍了一些常用的语音情感特征及其提取算法,最后介绍了3种语音情感识别算法,包括K近邻分类器、支持向量机和人工神经网络。
第9章介绍了语音合成与转换的基本原理。首先介绍了帧合成技术,然后介绍了3种语音合成算法,包括线性预测合成法、共振峰合成法和基音同步叠加技术,接着介绍了语音信号的变速和变调的原理和实现方法,最后介绍了语音转换的基本原理和研究方向。
第10章介绍了声源定位的基本原理。依次介绍了双耳听觉定位原理及方法和3种基于传声器阵列的声源定位方法,即基于最大输出功率的可控波束形成算法、基于到达时间差的定位算法和基于高分辨率谱估计的定位算法。此外,还介绍了传声器阵列模型以及可用于声源定位研究的房间回响模型。
第11章介绍了语音隐藏的基本原理。首先介绍了信息隐藏基础理论,然后主要介绍了两种语音隐藏算法:低比特位编码法和回声隐藏算法,最后介绍了算法的常用评价指标以及未来的研究方向。
第12章介绍了语音编码的基本原理。首先介绍了语音编码的理论基础,然后介绍语音编码的主要性能指标,接着依次介绍了3种语音编码算法的基本原理和典型代表,最后对未来研究进行了展望。
在附录中,给出了书中涉及的C++类库及引入的函数库和基于Visual Studio的语音采集程序框架及实现。
需要说明的是,书中加“[C]”的章节包含关键算法的C++函数及说明。
本书主要由梁瑞宇、赵力、王青云和唐闺臣编著,并由梁瑞宇最后统稿参加本书编写和校对整理工作的还有包永强、谢跃和赵立丞。本书的出版得到了江苏高校品牌专业建设工程项目(项目编号:PPZY2015A035)和江苏省2016年度教育科学规划重点资助课题(项目编号:B-a/2016/01/44)的资助。作者参考和引用了一些学者的研究成果,具体见参考文献。在此,作者向这些文献的著作者表示敬意和感谢,同时诚势感谢给予此书指导和帮助的老师和同学们。
《语音信号处理(C++版)》还可以配套《语音信号处理实验教程》(ISBN 978-7-111-53071-8)使用,以方便教师根据不同的学生层次和要求来组织实验教学,加深学生对知识的理解和掌握。
语音信号处理是一门理论性强、实用面广、内容新、难度大的交叉学科,同时这门学科又处于快速发展之中,尽管作者在编写过程中始终注重理论紧密联系实际,力求以尽可能简明、通俗的语言,深入浅出、通俗易懂地将这门学科介绍给读者,但因作者水平有限、时间较仓促,缺点错误在所难免,敬请广大读者批评指正。
编者
语音信号处理(C++版) 电子书 下载 mobi epub pdf txt