超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

不再提示
关闭
欢迎光临中图网 请 | 注册
> >>
深度神经网络FPGA设计与实现

深度神经网络FPGA设计与实现

出版社:西安电子科技大学出版社出版时间:2020-10-01
开本: 23cm 页数: 240页
本类榜单:教材销量榜
中 图 价:¥24.5(7.0折) 定价  ¥35.0 登录后可看到会员价
加入购物车 收藏
运费6元,满39元免运费
?新疆、西藏除外
本类五星书更多>

深度神经网络FPGA设计与实现 版权信息

深度神经网络FPGA设计与实现 本书特色

FPGA大大地降低了从算法到芯片电路的调试成本,是实现半定制人工智能芯片的*佳选择之一。本书为读者分享相关的设计和开发思路,值得拥有。 本书立足实际,致力于深度学习理论研究及其硬件应用开发,为读者分享相关的设计和开发思路,希望能够为相关的工程师提供参考

深度神经网络FPGA设计与实现 内容简介

本书依次对深度神经网络的发展、主流开发平台及基于FPGA的网络加速进行了详细的介绍。主要内容包括: 深度学习理论及AI芯片的发展、深度学习的主流开发平台及实践、FPGA神经网络开发基础优势及过程、FPGA神经网络的RTL级开发、基于FPGA的加速实例分析、基于OpenCL的FPGA神经网络加速开发、前沿神经网络加速压缩技术分析。

深度神经网络FPGA设计与实现 目录

第1章 深度学习及AI芯片 1 1.1 深度学习研究现状 1 1.1.1 深度学习的概念 1 1.1.2 深度学习和神经网络的发展历程 2 1.1.3 典型的深度神经网络 4 1.1.4 深度学习的典型应用 5 1.2 AI芯片研究现状 10 1.2.1 GPU 10 1.2.2 半制定FPGA 11 1.2.3 全定制ASIC 11 1.2.4 SoC 11 1.2.5 类脑芯片 12 第2章 深度学习开发平台 13 2.1 深度学习平台介绍 13 2.1.1 TensorFlow 13 2.1.2 Caffe 16 2.1.3 Pytorch 17 2.1.4 MXNet 19 2.1.5 CNTK 20 2.1.6 PaddlePaddle 21 2.1.7 Darknet 22 2.2 深度学习平台对比 23 第3章 深度神经网络基础层算子介绍 26 3.1 卷积算子 26 3.2 反卷积算子 29 3.3 池化算子 31 3.3.1 平均池化算子 31 3.3.2 *大池化算子 32 3.4 激活算子 33 3.5 全连接算子 34 3.6 Softmax算子 35 3.7 批标准化算子 36 3.8 Shortcut算子 37 第4章 FPGA基本介绍 39 4.1 FPGA概述 39 4.1.1 可编程逻辑器件 39 4.1.2 FPGA的特点 40 4.1.3 FPGA的体系结构 40 4.2 FPGA系列及型号选择 41 4.2.1 FPGA生产厂家 41 4.2.2 FPGA系列 42 4.2.3 基于应用的FPGA型号选择 44 4.3 FPGA性能衡量指标 44 第5章 FPGA神经网络开发基础 46 5.1 FPGA开发简介 46 5.2 FPGA的结构特性与优势 46 5.3 FPGA深度学习神经网络加速计算的开发过程 48 5.3.1 神经网络模型计算量分析 48 5.3.2 神经网络模型访问带宽分析 51 5.3.3 加速硬件芯片选型 53 5.3.4 加速硬件系统设计 55 5.4 FPGA在深度学习方面的发展 58 第6章 FPGA神经网络计算的RTL级开发 60 6.1 搭建开发环境 60 6.1.1 开发环境的选择 60 6.1.2 开发环境的搭建 61 6.2 RTL级开发的优势与劣势 63 6.3 RTL级开发的基本流程 63 6.3.1 需求理解 65 6.3.2 方案评估 65 6.3.3 芯片理解 65 6.3.4 详细方案设计 68 6.3.5 RTL级HDL设计输入 79 6.3.6 功能仿真 81 6.3.7 综合优化 82 6.3.8 布局布线与实现 82 6.3.9 静态时序分析与优化 83 6.3.10 芯片编程与调试 83 6.4 RTL级神经网络加速设计流程 83 6.5 RTL级神经网络加速仿真 84 6.6 RTL级神经网络加速时序优化 84 第7章 基于FPGA实现YOLO V2模型计算加速实例分析 86 7.1 神经网络基本算子的FPGA实现 86 7.1.1 加速逻辑方案整体设计 86 7.1.2 卷积算子设计 89 7.1.3 全连接算子设计 97 7.1.4 池化算子设计 100 7.2 FPGA YOLO V2的顶层设计 103 7.2.1 YOLO V2模型简介 103 7.2.2 YOLO V2模型结构 105 7.2.3 YOLO V2的FPGA实现设计 107 7.3 FPGA YOLO V2的模块设计 111 7.3.1 卷积 111 7.3.2 YOLO V2偏置、归一化/缩放/激活 114 7.3.3 激活函数 116 7.4 FPGA YOLO V2的系统和RTL仿真 116 7.5 FPGA YOLO V2系统时序优化 118 7.5.1 插入寄存器 118 7.5.2 并行化设计 120 7.5.3 均衡设计 124 7.5.4 减少信号扇出 126 7.5.5 优化数据信号路径 127 7.6 性能对比 128 7.6.1 S10的检测流程 128 7.6.2 检测结果 129 7.6.3 与GPU的性能对比 130 第8章 基于OpenCL的FPGA神经网络计算加速开发 132 8.1 OpenCL基础 132 8.1.1 OpenCL简介 132 8.1.2 OpenCL模型 133 8.1.3 命令事件 140 8.2 OpenCL FPGA开发流程 141 8.2.1 搭建OpenCL开发环境 141 8.2.2 开发流程 144 8.3 OpenCL程序优化 160 8.3.1 数据传输优化 160 8.3.2 内存访问优化 161 8.3.3 数据处理优化 163 8.3.4 其他优化手段 170 8.3.5 矩阵乘法优化实例 170 8.4 OpenCL FPGA实例 176 8.4.1 分类任务 176 8.4.2 目标检测 201 第9章 神经网络压缩与加速技术 221 9.1 神经网络剪枝压缩与权值共享方法 221 9.1.1 神经网络剪枝 222 9.1.2 权值共享 223 9.2 低秩估计 226 9.3 模型量化 227 9.3.1 二值化权重 227 9.3.2 三值化权重 228 9.3.3 二值化神经网络 229 9.3.4 多位神经网络 230 9.4 知识蒸馏 231 参考文献 234
展开全部

深度神经网络FPGA设计与实现 作者简介

本书从深度神经网络和AI芯片研究现状出发,系统地论述了目前深度学习主流开发平台和深度神经网络基于FPGA平台实现加速的开发原理和应用实例。全书主要包括5部分:第1~2章介绍了深度神经网络的发展,并总结了深度学习主流开发平台和AI芯片的研究现状;第3~6章在对深度神经网络基础层算子、FPGA进行了介绍后,总结了FPGA神经网络开发基础及RTL级开发;第7章分析了基于FPGA实现神经网络加速的实例;第8章介绍了基于OpenCL的FPGA神经网络计算加速开发;第9章分析了前沿神经网络压缩与加速技术。 本书可以为人工智能、计算机科学、信息科学、神经网络加速计算研究者或者从事深度学习、图像处理的相关研究人员提供参考,也可作为相关专业本科生及研究生的教学参考书。

商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服