-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
新一代人工智能与语音识别 版权信息
- ISBN:9787302523840
- 条形码:9787302523840 ; 978-7-302-52384-0
- 装帧:一般纯质纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
新一代人工智能与语音识别 本书特色
本书系统介绍基于新闻语料的俄语连续语音识别方法。全书共分以下几个部分:基于Kaldi设计实现俄语连续语音识别原型系统,使之具备在线识别和离线识别功能,以验证声学模型和语言模型优化算法的有效性,进而为面向特定领域的俄语语音识别实用系统研发提供理论方法、实验数据和关键技术支撑。为了实现上述目标,需要进行如下环环紧扣的操作步骤:俄语语音语料的采集加工处理、俄语文本语料的采集清洗过滤、俄语发音词典的自动预测生成、声学模型建模基本单元(音素集)的确定、声学模型和语言模型的优化等。
新一代人工智能与语音识别 内容简介
本书系统介绍基于新闻语料的俄语连续语音识别方法。全书共分以下几个部分:基于Kaldi设计实现俄语连续语音识别原型系统,使之具备在线识别和离线识别功能,以验证声学模型和语言模型优化算法的有效性,进而为面向特定领域的俄语语音识别实用系统研发提供理论方法、实验数据和关键技术支撑。为了实现上述目标,需要进行如下环环紧扣的操作步骤:俄语语音语料的采集加工处理、俄语文本语料的采集清洗过滤、俄语发音词典的自动预测生成、声学模型建模基本单元(音素集)的确定、声学模型和语言模型的优化等。
新一代人工智能与语音识别 目录
第0章绪论1
0.1研究依据1
0.2研究对象与研究目标2
0.3研究方法3
0.4研究意义3
0.5本书的创新点4
0.6语料来源4
0.7本书的结构5
第1章语音识别技术研究综述7
1.1语音识别的定义与分类7
1.1.1语音识别的定义7
1.1.2语音识别的分类8
1.2语音识别技术的研究进展9
1.2.1语音识别技术的发展概况9
1.2.2国外俄语语音识别技术的研究进展10
1.2.3中国俄语语音识别技术的研究进展13
1.3语音识别系统的基本原理14
1.3.1特征提取15
1.3.2声学模型16
1.3.3语言模型17
1.3.4解码18
1.4语音识别技术研究所关注的关键问题19
本章小结21〖4〗新一代人工智能与语音识别〖2〗目录〖4〗第2章语音数据的加工处理22
2.1问题描述22
2.2众包的定义及内涵23
2.2.1众包的基本概念23
2.2.2众包的基本流程24
2.2.3众包的关键问题24
2.3解决方案25
2.3.1质量控制25
2.3.2语音标注平台的架构27
2.3.3标注平台的设计与实现28
2.4语音标注31
2.4.1语音有效性判断31
2.4.2语音转写规范32
2.4.3语音标注规范32
2.5实验设计与结果分析33
2.5.1实验设计33
2.5.2结果分析34
2.5.3结论36
本章小结36
第3章俄语声学模型的建立37
3.1连续语音识别37
3.1.1连续语音识别的整体模型38
3.1.2声学模型训练的HMMGMM方法40
3.1.3声学模型训练中的HMMDNN方法48
3.2俄语语音学概述52
3.2.1俄语的使用及分布情况52
3.2.2俄语语音的基本特点55
3.2.3俄语音素的发音特征56
3.2.4俄语元音音素的随位变化58
3.2.5俄语辅音音素的随位变化60
3.3俄语声学单元的选择61
3.3.1俄语SAMPA音素集61
3.3.2俄语音系表64
3.4实验设计与结果分析64
3.4.1实验设计65
3.4.2结果分析66
本章小结67
第4章俄语语言模型的建立68
4.1文本语料的准备与清洗68
4.1.1数据来源的筛选69
4.1.2数据爬取71
4.1.3数据的去重与清洗71
4.1.4格式化处理74
4.2语言模型简述75
4.2.1语言模型的平滑技术77
4.2.2语言模型的剪枝算法81
4.3语言模型的训练流程84
4.3.1语言模型的训练实现84
4.3.2词典的选择85
4.3.3LM的剪枝与优化87
4.4实验结果分析89
4.4.1词典规模测试89
4.4.2语料规模测试89
4.4.3语言模型剪枝测试90
本章小结91
第5章基于Kaldi的俄语语音识别原型系统92
5.1系统设计的目标与原则92
5.1.1系统设计的目标92
5.1.2系统设计的原则92
5.2系统的开发环境与整体架构93
5.2.1系统的开发环境93
5.2.2系统的整体架构93
5.3Kaldi环境的搭建94
5.3.1Kaldi及实验环境94
5.3.2Kaldi训练服务器的搭建96
5.3.3AM训练数据及参数设置98
5.3.4LM训练数据及参数设置107
5.4Kaldi训练优化111
5.4.1Kaldi声学建模111
5.4.2GPU加速113
5.5语音识别原型系统的设计114
5.5.1系统GUI的设计114
5.5.2在线识别功能114
5.5.3离线识别功能117
5.6实验设计与结果分析119
5.6.1实验设计119
5.6.2实验结果119
5.6.3结果分析120
本章小结121
第6章总结与展望122
6.1本书的主要成果122
6.2未来的研究计划123
附录A英汉术语对照表124
附录B其他相关资料126
B.1俄语发音词典(76277个词形)示例126
B.2俄语解码词表(189971个词形)示例127
B.3俄语字符Unicode编码对照表128
B.4俄语语音格式化程序(转换为16KB、16b)128
B.5俄语文本转Unicode编码程序129
B.6从https: //twitter.com网站上下载的部分网页文件
(json格式)示例131
B.7从http: //www.interfax.ru网站上下载的部分网页
文件(json格式)示例131
B.8俄语拉丁字母转写表132
参考文献134
新一代人工智能与语音识别 作者简介
马延周,男,战略支援部队信息工程大学洛阳校区,副教授,博士研究生
1996-2000,解放军信息工程大学学员,计算机应用专业
2000-2005,解放军外国语学院基础部讲师
2005-2008,解放军信息工程大学硕士研究生,计算机技术应用
2008-2012,解放军外国语学院基础部讲师
2012-2016,解放军外国语学院博士研究生,语言信息处理(语音识别)
2013-2015,中国科学技术大学、科大讯飞研究院访学,主要研究连续语音识别
2016-,解放军信息工程大学洛阳校区(原解放军外国语学院)副教授马延周,男,战略支援部队信息工程大学洛阳校区,副教授,博士研究生
1996-2000,解放军信息工程大学学员,计算机应用专业
2000-2005,解放军外国语学院基础部讲师
2005-2008,解放军信息工程大学硕士研究生,计算机技术应用
2008-2012,解放军外国语学院基础部讲师
2012-2016,解放军外国语学院博士研究生,语言信息处理(语音识别)
2013-2015,中国科学技术大学、科大讯飞研究院访学,主要研究连续语音识别
2016-,解放军信息工程大学洛阳校区(原解放军外国语学院)副教授
从教18年来,主要承担计算机类、语言信息类本硕博课程的主讲与辅导任务,主持或参与的国家级、省部级、院校级各类项目17余项是,主编或参编的教材4部。科研成果主要集中在多语种的信息处理(如语音识别、关键词识别、声纹识别等领域)及多语种语料的采集处理等领域。
2016年博士论文获解放军外国语学院优秀博士论文,排名第一。
2017年申报河南省优秀博士论文,2018年4月获批河南省优秀博士论文(当年,全省15篇优秀博士论文)。
- >
中国人在乌苏里边疆区:历史与人类学概述
中国人在乌苏里边疆区:历史与人类学概述
¥35.5¥48.0 - >
龙榆生:词曲概论/大家小书
龙榆生:词曲概论/大家小书
¥13.0¥24.0 - >
二体千字文
二体千字文
¥14.0¥40.0 - >
唐代进士录
唐代进士录
¥15.1¥39.8 - >
罗庸西南联大授课录
罗庸西南联大授课录
¥13.8¥32.0 - >
月亮虎
月亮虎
¥14.4¥48.0 - >
史学评论
史学评论
¥23.5¥42.0 - >
上帝之肋:男人的真实旅程
上帝之肋:男人的真实旅程
¥19.3¥35.0
-
十二字节
¥42.4¥69 -
前瞻交互:从语音、手势设计到多模融合
¥76.3¥109 -
人工智能
¥18.6¥55 -
人工智能技术商业应用场景实战
¥45.8¥79 -
4.23文创礼盒A款--“作家言我精神状态”
¥42.3¥206 -
4.23文创礼盒B款--“作家言我精神状态”
¥42.3¥206