背景

在进行大模型训练的时候,往往需要用到多张GPU卡,如何实现多卡的管理和监控,这是一个比较好的话题,下面介绍一个小工具。

安装nvitop

pip install nvitop
nvitop -m full

监控界面

Logo

技术共进,成长同行——讯飞AI开发者社区