Публикации по теме 'deep-leraning'


Обучение с подкреплением с Keras + OpenAI: DQN
Краткий обзор В прошлый раз в нашем руководстве по Keras / OpenAI мы обсудили очень простой пример применения глубокого обучения в контекстах обучения с подкреплением. Оглядываясь назад, это было невероятное зрелище! Если вы посмотрите на данные обучения, то модели случайного шанса обычно будут способны выполнять только 60 шагов в среднем. И все же, обучаясь на этих, казалось бы, очень посредственных данных, мы смогли «превзойти» среду (т. Е. Получить производительность ›200 шагов)...