神经网络加速指南

分析各步骤耗时1、CPU上的操作耗时：尝试将操作放在GPU上进行，如np.argmax的操作2、.cpu()耗时尝试减少传输tensor的大小3、数据预处理耗时1）resample操作尝试放到GPU上处理？2）先crop后resample？4、调用不同的包耗时不同如scipy / skimage / sklearn / numpy5、网络运行耗时1）inference时......

emergency_rose

729人浏览 · 2020-08-22 20:42:13

emergency_rose · 2020-08-22 20:42:13 发布

分析各步骤耗时

1、CPU上的操作耗时：

尝试将操作放在GPU上进行，如np.argmax的操作

2、.cpu()耗时

尝试减少传输tensor的大小

3、数据预处理耗时

1）resample操作尝试放到GPU上处理？

2）先crop后resample？

4、调用不同的包耗时不同

如scipy / skimage / sklearn / numpy

5、网络运行耗时

1）inference时可以不对网络权重进行初始化操作

2）选用不同的网络框架

3）减少channel数

4）减少层数

6、其他

1）torch.backends.cudnn.benchmark

2）.half() 操作可以减少显存占用，但在V100等高端机器上优化做的很好，普通机器上速度奇慢

3）训练时不建议使用torch.cuda.empty_cache()，会减慢训练速度

技术共进，成长同行——讯飞AI开发者社区

更多推荐

1747张YOLO标注奶牛水牛识别数据集：精准标注跨场景动物检测模型训练专用计算机视觉数据集，助力智慧农业与畜牧业AI算法研发

讯飞AI开发者社区

YOLOv8【卷积创新篇·第25节】Capsule Network胶囊卷积网络：让检测器拥有“空间想象力”！

讯飞AI开发者社区

YashanDB在医疗行业的应用与机遇

随着医疗行业数据规模的持续扩展和智能医疗应用的深化，数据库系统的性能和可靠性成为医疗信息化的核心竞争力。未来，随着医疗场景对人工智能、大数据实时分析等技术的不断融合，YashanDB将持续深化HTAP能力，增强分布式协作与资源整合能力，通过不断优化系统性能和安全保障，推动医疗行业数据管理水平的全面提升，为智慧医疗服务的广泛应用奠定坚实基础。YashanDB在医疗行业中，基于强大的逻辑架构，实现了客