RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

た 入场券 2021-10-15 21:49 844阅读 0赞
  1. Pytorch 训练时,使用Resnet18遇到错误:
  2. RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
  3. 通过设置以下语句,解决:
  4. torch.backends.cudnn.enabled = False

关于torch.backends.cudnn.enabled 的使用:

设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法,来达到优化运行效率的问题。

应该遵循以下准则:

  1. 如果网络的输入数据维度或类型上变化不大,设置 torch.backends.cudnn.benchmark = true 可以增加运行效率;
  2. 如果网络的输入数据在每次 iteration 都变化的话,会导致 cnDNN 每次都会去寻找一遍最优配置,这样反而会降低运行效率。

具体导致出现 CUDNN_STATUS_EXECUTION_FAILED的原因,暂时不清楚!

发表评论

表情:
评论列表 (有 0 条评论,844人围观)

还没有评论,来说两句吧...

相关阅读