Indexed by:
Abstract:
深度学习是多层神经网络上运用各种机器学习理论解决图像、文本等各种问题的算法集合。卷积神经网络则是其中一种经典而广泛应用的数学模型。从结构来看,典型网络模型Alexnet、VGG、Googlenet和Resnet的发展趋势是它们的层数越来越深。这些卷积神经网络为了更好的性能,通常参数规模庞大,计算复杂度高,因此目前深度学习也在GPU端运行。近几年来,移动终端设备逐渐普及,基于嵌入式系统平台应用深度学习的图像分类和识别技术具有极大价值。研究面向嵌入式系统和终端的深度神经网络模型压缩算法,以便缩减模型大小和降低存储空间的需求,优化模型计算过程。
设计精细的网络架构模型是模型压缩中一种重要方法。在本文中将探讨如何为嵌入式计算系统设计高效的轻量级深度神经网络架构以及充分利用嵌入式计算系统的特性加速模型。本文面向ZYNQ嵌入式系统平台提出了一个新的轻量级深度神经网络模型L-Mobilenet。L-Mobilenet可以很好地适应硬件计算和加速,其网络结构受Inception-R
esnet和Mobilenet-v2的最新工作的启发,可以有效地减少参数和延迟,同时保持推理的准确性。本文将L-Mobilenet模型在Cifar数据集中进行测试,其次部署到ZYNQ嵌入式平台,以全面评估网络性能。实验表明,L-Mobilenet模型能够获得比Mobilenet-v2快3倍的速度和3.7倍少的参数,同时保持相似的精度。与Shufflenet-v2相比,它还可以获得2倍的加速和1.5倍少的参数,同时保持相同的精度。在ZYNQ嵌入式平台的ARM处理器端L-Mobilenet网络模型可以获得更好的性能。最后,本文利用ZYNQ平台可编程逻辑端对矩阵乘加运算友好的特性加速深度神经网络的卷积层,进一步提高网络的推理速度。
Keyword:
Reprint Author's Address:
Basic Info :
Degree: 工程硕士
Mentor: 刘龙军
Year: 2019
Language: Other
Affiliated Colleges: