MindSpore版本:1.2.0

cann:5.0.1.spc1.2

模型:bert

场景:使用两个形同bert模型对两个词语或短句进行相似度匹配

问题:模型跑起来以后aicore资源利用率为0,并且训练一个batch需要花60s以上的时间,如下图

说明:代码基本都是自己实现,没有参照码云仓bert模型实现,只有在前向梯度累加部分完全复用MindSpore官网代码,链接:https://www.mindspore.cn/tutorial/training/zh-CN/r1.2/advanced_use/apply_gradient_accumulation.html

 主要原因还是代码的问题,由于前向使用的是官网提供的梯度累加的代码,直接改为封装好的api,model.train问题解决

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐