«Начните с конца в уме». Это вторая привычка Стивена Р. Кови в его чрезвычайно успешной книге Семь навыков очень успешных людей. Он начинает с драматического упражнения в воображении собственной смерти — конца жизни, о котором вы должны помнить. В постоянно меняющемся и непредсказуемом мире 21 века этот совет может показаться устаревшим. Долгосрочные планы проектов закончились, а Agile появился. Должны ли мы по-прежнему начинать с конца?

Даже в компьютерный век мы можем извлечь выгоду, если будем помнить о конце. Я узнаю это все больше и больше, обучая компьютеры играть в обычные настольные и карточные игры. Сами компьютеры выигрывают, когда начинают с мыслями о конечном результате.

В многопользовательских играх игроки делают свой ход, а затем передают управление другому игроку. Это создает неопределенность для игрока. Игрок не может знать, какой ход выберет его противник. Шахматные гроссмейстеры должны предвидеть каждый возможный ход своего противника и думать на несколько ходов вперед. Компьютеры могут делать это намного лучше, чем люди, и поэтому могут легко победить большинство игроков-людей в играх такого типа.

На первый взгляд, игрок может решить сделать ход, который с наибольшей вероятностью приведет к выигрышу, при условии равной вероятности того, что противник сделает все доступные ходы. Кратко рассмотрим эту методологию. Рассмотрим дерево решений ниже. Зеленые узлы — это ваши ходы, а красные узлы — ходы вашего противника. Выигрыши - W, проигрыши - L.

Как видите, ходы A и B могут привести либо к 2 выигрышам, либо к 2 проигрышам. Используя методологию, описанную выше, оба хода A и B являются одинаково сильными ходами. Однако мудрый игрок выбрал бы ход А. Когда зеленый игрок делает ход А, она может выиграть, независимо от того, делает ли красный игрок ход А1 или А2. Однако, если зеленый игрок делает ход B, красный игрок может вызвать проигрыш, сыграв B2.

Обучая машину играть в эту игру, она учится делать ходы, которые с большей вероятностью приведут к победе. Первоначально машина будет принимать примерно равные решения между двумя ходами. По мере того, как и красные, и зеленые игроки учатся, красный игрок начнет чаще делать ход B1, а зеленый игрок также начнет чаще делать окончательные выигрышные ходы. Это приведет к тому, что зеленый будет учиться делать ход А, а не ход Б. Однако машина будет учиться медленно, сохраняя предвзятость из более ранних игр, в которых красный делал ход В2.

Можно ли улучшить этот метод? Да! Машина просто должна начать с конца! Алгоритм обучения создает больший вес для ходов, сделанных в конце, которые приводят к победе. Поскольку у обоих последних зеленых узлов есть ход, гарантирующий победу, эти решения должны придавать больший вес алгоритму, выбирающему A. Можно, например, засчитать выигрышный ход в конце как две победы. Если вы снова окажетесь в этой позиции, вам гарантирован выигрыш.

Реальная жизнь имеет много общего с этими играми. Вы делаете свои ходы и контролируете то, что можете, но есть много факторов, которые вам неподвластны. Если вы будете более тщательно взвешивать свои последние ходы и ставить себя так, чтобы нанести удар и победить в конце, вы повысите свои шансы на успех. Даже в век информации мы должны начинать с конца.