nn.RNN中参数batch_first设为True后,网络的输出变得内存不连续,is_continuous()为False

在LSTM或RNN中,当把batch_first设为True后,假设输出为output,发现output.view()报错了,于是逐步打印了每个变量的is_contiguous(),发现lstm的输入embeds是内存连续的,经过lstm后变得不连续,问了一下newbing ,个人理解这里出现输入连续而经过lstm后变得不连续的原因应该就是batch_first设为True相当于在LSTM内部对输入数据先转置了一下变成标准的默认的(seq_len,batch_size)型再进行后续运算,因此变得内存不连续了。,解决方法也很简单,要用.view()的时候改成.contiguous().view()或者直接改成.reshape()就好了。

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐