技术纵横
陈畅, 黄均才, 刘鉴栋, 袁晶
2022, 22(2): 41-45.
卷积神经网络优异的性能使其在图像处理领域占有重要地位, 然而模型的实际应用多依赖于GPU, 难以部署在对功耗敏感的嵌入式设备上。为了使模型能够高效部署在以FPGA为基础的平台上, 本文提出一种卷积神经网络定点化方法, 以数据精度与资源消耗为设计指标, 根据模型中数据分布的统计以及数据类型的划分, 确定不同的定点化策略, 并给出了不同量化方法与溢出模式和硬件资源消耗的关系。使用Xilinx定点化库进行测试, 实验结果表明, 使用16位定点数对模型进行统一量化, 能够在较小的精度损失下降低硬件资源消耗, 且不同的量化模式下硬件资源消耗相同, 不同的溢出模式下硬件资源消耗区别较大。