量化

量化就是将神经网络的浮点算法转换为定点。 量化有若干相似的术语。低精度(Low precision)可能是最通用的概念。常规精度一般使用 FP32(32位浮点,单精度)存储模型权重;低精度则a56爆大奖在线娱乐 FP16(半精度浮点),INT8(8位的定点整数)等等数值格式。不过目前低精度往往指代 INT8。 量化
posted @ 2022-01-11 11:28  心如__止水  阅读(336)  评论(0编辑  收藏  举报