В следующем обработчике CNTK create_trainer (на python) я пытаюсь понять, что означают эти два уравнения — я считаю, что это скорость обучения на мини-пакет, но остальная часть не комментируется Microsoft. Кто-нибудь понимает эти уравнения lr_per_mb и их значение?
lr_per_mb = [1,0]*80+[0,1]*40+[0,01]
lr_per_mb = [0,1]*1+[1,0]*80+[0,1]*40+[0,01]
def create_trainer (сеть, размер_минипакета, размер_эпохи, количество_битов_квантизации, размер_блока, прогрев, прогресс_принтер):
if network['name'] == 'resnet20':
lr_per_mb = [1.0]*80+[0.1]*40+[0.01]
elif network['name'] == 'resnet110':
lr_per_mb = [0.1]*1+[1.0]*80+[0.1]*40+[0.01]
else:
return RuntimeError("Unknown model name!")