Как я могу улучшить изучение FCN32 для семантической сегментации?

Я с нуля обучил FCN32 семантической сегментации своих данных и получил следующее вывод: введите здесь описание изображения

Как видно, это не очень хорошая кривая обучения, показывающая неправильное обучение данным. solver выглядит следующим образом:

net: "train_val.prototxt"
#test_net: "val.prototxt"
test_iter: 5105 #736
# make test net, but don't invoke it from the solver itself
test_interval: 1000000 #20000
display: 50
average_loss: 50
lr_policy: "step" #"fixed"
stepsize: 50000 #+
gamma: 0.1  #+
# lr for unnormalized softmax
base_lr: 1e-10 
# high momentum
momentum: 0.99
# no gradient accumulation
iter_size: 1
max_iter: 600000
weight_decay: 0.0005
snapshot: 30000
snapshot_prefix: "snapshot/FCN32s_CNN1"
test_initialization: false
solver_mode: GPU

после изменения скорости обучения на 0,001 стало хуже: введите здесь описание изображения Мне интересно, что я могу сделать для улучшения обучения? Спасибо


person S.EB    schedule 20.02.2017    source источник


Ответы (1)


Вы можете попробовать изменить скорость обучения. Хорошие значения обычно находятся между 0,1 и 0,0001.

person Thomas Pinetz    schedule 20.02.2017
comment
Спасибо за ваше предложение, я отредактировал вопрос, когда я устанавливаю скорость обучения на 0,001, кривая обучения становится хуже. - person S.EB; 21.02.2017
comment
Потеря на самом деле лучше числом мудрым. Но ваша скорость обучения кажется слишком высокой сейчас. - person Thomas Pinetz; 21.02.2017
comment
Спасибо Томас за ваше предложение - person S.EB; 21.02.2017