神经网络参数初始化参数固定

一般来说，神经网络模型实验重复多次，但最终结果仍然有较大波动时，应该从三个方面结果：种子、初始点、优化器。其中种子的固定尤为关键，应在代码中加入下列种子固定代码def setup_seed(seed):random.seed(seed)np.random.seed(seed)torch.manual_seed(seed)torch.cuda.manual_seed_all(seed)torch.b

yimenren

1986人浏览 · 2022-03-19 19:23:11

yimenren · 2022-03-19 19:23:11 发布

一般来说，神经网络模型实验重复多次，但最终结果仍然有较大波动时，应该从三个方面结果：种子、初始点、优化器。

1.种子

其中种子的固定尤为关键，应在代码中加入下列种子固定代码

def setup_seed(seed):
    random.seed(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False
    dgl.seed(seed)
setup_seed(seed)

2.初始化

可以使用xavier正态分布

nn.init.xavier_normal_(self.fc_src.weight, gain=gain)

也可以使用kaiming均匀分布

 nn.init.kaiming_uniform_(self.fc_src.weight, a=self.negative_slope)

3.优化器

使用Adam优化器，固定学习学率lr和weight_decay

optimizer = torch.optim.Adam(model.parameters(),lr=args.lr,weight_decay=args.weight_decay)

技术共进，成长同行——讯飞AI开发者社区

更多推荐

大模型入门书单：五本书就够了，带你从0到1，深入理解AI大模型！

讯飞AI开发者社区

一 . 机器学习

讯飞AI开发者社区

一场人工智能革命:Graph XAI图增强智能

讯飞AI开发者社区

所有评论(0)

查看更多评论

yimenren

@yimenren

已为社区贡献4条内容