-
>
湖南省志(1978-2002)?铁路志
-
>
公路车宝典(ZINN的公路车维修与保养秘籍)
-
>
晶体管电路设计(下)
-
>
基于个性化设计策略的智能交通系统关键技术
-
>
德国克虏伯与晚清火:贸易与仿制模式下的技术转移
-
>
花样百出:贵州少数民族图案填色
-
>
识木:全球220种木材图鉴
数据驱动的机器翻译技术 版权信息
- ISBN:9787121483073
- 条形码:9787121483073 ; 978-7-121-48307-3
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 所属分类:>>
数据驱动的机器翻译技术 内容简介
机器翻译是由计算机自动将一种自然语言翻译成另一种自然语言的过程。随着语言资源规模的持续增长和计算机硬件技术的大幅提高,数据驱动的机器翻译方法逐渐获得了研究者的青睐,翻译效果取得了显著的提升。本书梳理了机器翻译的基础理论和研究进展,指出了数据驱动的机器翻译方法所面临的问题,详细介绍了具有代表性的改进方法。这些方法既包括对句法语义、词形和零代词、翻译记忆等先验知识的建模及融合,也涉及深度神经网络、无监督树学习、生成对抗训练、联合学习、因果推断等前沿技术,可供希望深入了解机器翻译研究进展的读者参考。本书的*后对数据驱动的机器翻译技术进行了总结,并对未来的研究方向进行了展望。
数据驱动的机器翻译技术 目录
1.1 研究背景及意义1
1.2 机器翻译发展简史2
1.3 研究内容及全书总览4
参考文献8
第2章 基础理论9
2.1 基于规则的机器翻译9
2.2 基于实例的机器翻译10
2.3 统计机器翻译11
2.3.1 噪声信道模型11
2.3.2 对数线性模型12
2.3.3 基于短语的统计机器翻译模型12
2.3.4 基于句法的统计机器翻译模型14
2.3.5 语言模型16
2.3.6 统计机器翻译存在的问题20
2.4 神经机器翻译20
2.4.1 基于循环神经网络的神经机器翻译模型21
2.4.2 基于卷积神经网络的神经机器翻译模型24
2.4.3 基于注意力网络的神经机器翻译模型27
2.4.4 束搜索30
2.4.5 神经机器翻译存在的问题及发展趋势31
参考文献34
第3章 基于句法语义知识的统计机器翻译44
3.1 引言44
3.2 基于句法和语义的统计机器翻译基础方法45
3.2.1 基于句法的统计机器翻译模型46
3.2.2 语义角色标注47
3.2.3 语义角色标注在统计机器翻译中的应用48
3.2.4 串到树模型49
3.3 基于浅层语义结构的统计机器翻译52
3.3.1 谓词-论元增强型句法树52
3.3.2 句法补充的谓词-论元树54
3.3.3 翻译规则的学习55
3.3.4 实验与分析56
3.4 基于句法语言模型的统计机器翻译62
3.4.1 句法语言建模的基础方法62
3.4.2 融合浅层句法特征的循环神经网络语言模型63
3.5 本章小结70
参考文献71
第4章 句法知识与神经机器翻译联合学习模型82
4.1 引言82
4.2 树结构学习的基础方法83
4.2.1 树结构的神经网络编码器84
4.2.2 树结构的神经网络解码器85
4.2.3 无监督树学习85
4.2.4 利用统计机器翻译短语表87
4.2.5 在神经机器翻译中学习短语87
4.2.6 基于句法的神经机器翻译88
4.2.7 对齐学习89
4.3 源端句法信息与神经机器翻译联合学习模型89
4.3.1 无监督树编码器90
4.3.2 无监督树与神经机器翻译联合学习92
4.3.3 实验分析97
4.3.4 实例分析101
4.4 双语句法成分对齐与神经机器翻译联合学习模型105
4.4.1 概述105
4.4.2 无监督树编码器107
4.4.3 对齐样本构建107
4.4.4 深度度量损失108
4.4.5 实验分析109
4.5 基于跨语言句法互信息的机器翻译114
4.5.1 概述114
4.5.2 双语句法对齐117
4.5.3 优选化双语句法相互依存120
4.5.4 实验分析121
4.6 本章小结126
参考文献126
第5章 基于句子对齐信息的机器翻译训练138
5.1 引言138
5.2 问题分析141
5.3 基于自注意力机制的对齐判别器143
5.3.1 基于门控自注意力网络的句子编码器144
5.3.2 句子对齐得分计算与判别器损失函数145
5.3.3 判别器训练数据构建与预训练146
5.4 基于对齐信息的神经机器翻译对抗训练147
5.4.1 判别损失函数147
5.4.2 Gumbel-Softmax 采样148
5.4.3 教师强制步骤149
5.4.4 固定的判别器与对抗的判别器149
5.5 基于对齐感知的神经机器翻译解码方法150
5.5.1 融合判别器得分的解码得分151
5.5.2 融合基于对齐的价值网络解码151
5.6 本章小结152
参考文献157
第6章 融合翻译记忆的神经机器翻译方法163
6.1 引言163
6.2 问题分析163
6.3 融合翻译记忆相似度的文本预处理方法165
6.3.1 模板165
6.3.2 相关工作166
6.3.3 基于多维相似度的机器翻译测试集预处理策略167
6.4 融合翻译记忆的机器翻译训练方法170
6.4.1 引言170
6.4.2 相关工作171
6.4.3 基于多维相似度的机器翻译训练方法172
6.4.4 实验分析174
6.5 融合模板翻译记忆的神经机器翻译方法178
6.5.1 概述178
6.5.2 相关工作179
6.5.3 翻译模板的定义与构建180
6.5.4 融合模板翻译记忆的神经机器翻译187
6.5.5 实验分析191
6.6 本章小结197
参考文献198
第7章 词形预测与神经机器翻译联合模型202
7.1 引言202
7.2 问题分析204
7.2.1 拉丁字符大小写对神经机器翻译的影响204
7.2.2 单词阴阳性对机器翻译的影响206
7.3 大小写敏感的神经机器翻译207
7.3.1 神经机器翻译模型207
7.3.2 引入大写标注的神经机器翻译208
7.3.3 神经机器翻译与大写预测联合学习209
7.4 性别敏感的神经机器翻译212
7.4.1 性别平衡伪数据构建方法213
7.4.2 插入性别标注214
7.4.3 性别预测与机器翻译联合建模214
7.5 本章小结215
参考文献218
第8章 融合零代词信息的机器翻译方法225
8.1 引言225
8.2 零代词推断的基础方法227
8.2.1 基于规则的方法227
8.2.2 序列标注法228
8.2.3 融入语义特征的方法229
8.3 基于特征的零代词推断方法232
8.3.1 融入双语信息的语料重构232
8.3.2 零代词处理方法235
8.4 基于CRF和SVM的零代词信息构建方法236
8.4.1 基于CRF的零代词位置标注236
8.4.2 基于SVM的零代词分类238
8.5 基于深度学习的零代词信息构建方法242
8.5.1 基于LSTM的零代词位置标注243
8.5.2 基于LSTM的零代词分类245
8.5.3 基于编码器-解码器架构的零代词重构模型245
8.6 融合零代词信息的统计机器翻译247
8.6.1 概述247
8.6.2 语料预处理方法247
8.6.3 概率特征方法248
8.6.4 译文重排序方法250
8.6.5 实验分析251
8.6.6 实验结果及分析254
8.7 基于无监督树学习和零代词重构的神经机器翻译258
8.7.1 概述258
8.7.2 基于零代词重构的口语机器翻译模型259
8.7.3 实验及分析263
8.8 本章小结271
参考文献271
第9章 基于因果推断的译文评分去噪声方法274
9.1 引言274
9.2 相关工作和背景知识278
9.2.1 NMT译文长度偏置问题278
9.2.2 句子级译文质量直接估计任务281
9.3 基于HSR的译文评分降噪方法283
9.3.1 基于HSR的NMT解码长度偏置修正283
9.3.2 讨论285
9.3.3 译文质量估计系统输出降噪方法287
9.4 NMT长度偏置消除实验290
9.4.1 回归模型的选择292
9.4.2 方法自适应性294
9.5 译文质量估计系统去噪声实验296
9.6 本章小结299
参考文献299
第10章 机器翻译评价及相关评测会议306
10.1 机器翻译评价指标307
10.1.1 准确率和召回率307
10.1.2 BLEU评价指标308
10.1.3 词错误率WER308
10.1.4 翻译编辑率TER309
10.1.5 NIST评价指标309
10.1.6 METEOR评价指标310
10.2 机器翻译大会WMT310
10.3 全国机器翻译大会CCMT312
10.4 国际口语翻译大会IWSLT313
10.5 NIST机器翻译公开评测314
10.6 亚洲语言机器翻译研讨会WAT315
参考文献316
第11章 总结与展望319
11.1 本书总结319
11.2 未来研究方向展望320
数据驱动的机器翻译技术 作者简介
黄河燕,1963年10月生,籍贯湖南。1986年1月加入中国共产党,1989年3月参加工作。1983年毕业于武汉测绘科技大学计算机系获学士学位,1986年毕业于国防科技大学计算机系获硕士学位,1989年毕业于中国科学院计算技术研究所获博士学位,后留所工作,先后任助理研究员、副研究员、研究员;1997年至2009年在中科院计算机语言信息工程研究中心任副主任、研究员并先后兼任中科院华建集团党委委员、副书记,2009年至今任北京理工大学计算机学院院长、教授,兼北京市海量语言信息处理与云计算应用工程技术研究中心主任及中-德语言信息处理联合实验室主任;现为国家"863计划”主题专家组成员、中国人工智能学会及中国中文信息学会副理事长、教育部计算机教学指导委员会委员、北京市学位委员会委员。主持承担了国家自科基金重点项目、"973计划”课题、"863计划”项目等20多项国家级科研攻关项目,获得了国家科技进步一等奖等8项国家级和省部级奖励,1997年享受国务院政府特殊津贴,2014年当选全国优秀科技工作者。
- >
诗经-先民的歌唱
诗经-先民的歌唱
¥18.7¥39.8 - >
随园食单
随园食单
¥21.6¥48.0 - >
中国历史的瞬间
中国历史的瞬间
¥16.7¥38.0 - >
二体千字文
二体千字文
¥21.6¥40.0 - >
人文阅读与收藏·良友文学丛书:一天的工作
人文阅读与收藏·良友文学丛书:一天的工作
¥14.7¥45.8 - >
唐代进士录
唐代进士录
¥15.1¥39.8 - >
姑妈的宝刀
姑妈的宝刀
¥9.0¥30.0 - >
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
¥9.9¥23.0
-
基于融合表征的多视图学习方法
¥23¥30 -
ANSYS电磁兼容仿真与场景应用案例实战
¥81.8¥109 -
业余无线电通信 第五版
¥62.6¥79 -
现代微波技术基础
¥14.5¥21 -
4.23文创礼盒A款--“作家言我精神状态”
¥42.3¥206 -
4.23文创礼盒B款--“作家言我精神状态”
¥42.3¥206