改变网络结构设计为什么会实现模型压缩和加速

Group convolution ? Group convolution最早出现在AlexNet中,是为了解决单卡显存不够,将网络部署到多卡上进行训练而提出。Group convolution可以减少单个卷积1/g的参数量。如何计算的呢? 假设 输入特征的的维度为$HWC_1$; 卷积核的维度为$
posted @ 2021-06-02 09:22  凌逆战  阅读(399)  评论(0编辑  收藏  举报