深度学习模型大小由什么决定？

几十MB几百MB。

深度物联网 · 2023-03-27 00:44:31 发布

在训练完一个网络保存模型以后，我常常会将最优的模型保存。最终大小可能是几十MB,可能是几百MB,但模型的大小是由什么决定的呢？其实我们的模型在我们确定网络结构以后就已经将模型的大小确定了，模型文件存放参数，参数数量又是网络结构决定，所以模型大小由网络结构决定。下面将具体介绍一下：

下面是一个单通道图像的输入LeNet-5网络前向计算模拟图：
在这里插入图片描述

整个网络占据权重的为Convolution/Innerproduct 两层，分别计算参数量为，：

C1： 5 x 5 x 20 = 500，5x5卷积核， 20个feature map输出，20个kernel
C2： 20x 5 x 5 x 50 = 25000 ，20维度输入，则20x5x5 kernel，50个feature map输出，即相当于20通道的图像输入，则需要20x5x5的kernel来卷积乘，50个这样的卷积核操作得到50个feature map，50个kernel
F1： 50x4x4x500 = 400000，50维度特征图输入，全连接，每个点做卷积乘，则kernel大小为50x4x4，共500个feature map输出，500个kernel
F2 : 500x1x1x10 = 5000，500维度特征图输入，全连接，kernel大小为500x1x1，共10个feature map输出，10个kernel