GPU有限,如何提高batch size
那么从:
https://github.com/mathildor/DeepLab-v3/blob/master/g3doc/faq.md
deeplabv3+也是谷歌团队,tensorflow就是他们的产品。可以看到提高batch size 的方法。
batchsize不仅对于batch normalization至关重要,而且梯度下降也需要一定的batchsize,比如batchsize=8
所以可以通过:
- 减少图片的面积,比如将图片crop到原来的一般大小。或者513*513->321*321,要注意2的倍数问题。
- 减小网络复杂度,将参数变少,比如换backbone。
- 并行使用更多GPU,这是普遍的用法,也是必须的,因为通常要8个甚至16个GPU一同工作。
注意使用:
session_config.gpu_options.allow_growth = True
with tf.train.MonitoredTrainingSession(
master=FLAGS.master,
is_chief=(FLAGS.task == 0),
config=session_config,
scaffold=scaffold,
checkpoint_dir=FLAGS.train_logdir,
summary_dir=FLAGS.train_logdir,
log_step_count_steps=FLAGS.log_steps,
save_summaries_steps=FLAGS.save_summaries_secs,
save_checkpoint_secs=FLAGS.save_interval_secs,
hooks=[stop_hook]) as sess:
while not sess.should_stop():
sess.run([train_tensor])
如果没有gpu_options.allow_growth我的一块gpu能跑batch size=3,如果加了这个设置,能跑batch size=4。
还没有评论,来说两句吧...