【深度学习填坑笔记1】nn.LSTM中设置 batch_first 为 True 后 output.is_continuous()为False
nn.LSTM()中设置参数batch_first=True后,对于一个内存连续的input,经过LSTM后得到的output变得内存不连续。
·
nn.RNN中参数batch_first设为True后,网络的输出变得内存不连续,is_continuous()为False
在LSTM或RNN中,当把batch_first设为True后,假设输出为output,发现output.view()报错了,于是逐步打印了每个变量的is_contiguous(),发现lstm的输入embeds是内存连续的,经过lstm后变得不连续,问了一下newbing ,个人理解这里出现输入连续而经过lstm后变得不连续的原因应该就是batch_first设为True相当于在LSTM内部对输入数据先转置了一下变成标准的默认的(seq_len,batch_size)型再进行后续运算,因此变得内存不连续了。,解决方法也很简单,要用.view()的时候改成.contiguous().view()或者直接改成.reshape()就好了。
更多推荐
所有评论(0)