фитнес в перевернутом маятнике

Какая фитнес-функция используется для решения перевернутого маятника?

Я развиваю нейронные сети с генетическим алгоритмом. И я не знаю, как оценить каждого в отдельности.

Я попытался минимизировать угол маятника и максимизировать пройденное расстояние в конце времени оценки (10 с), но это не сработало.

входными данными для нейронной сети являются: скорость тележки, положение тележки, угловая скорость маятника и угол маятника в момент времени (t). Выходные данные - это сила, приложенная в момент времени (t + 1).

заранее спасибо.


person user1931907    schedule 10.03.2015    source источник


Ответы (1)


Я нашел этот документ, в котором перечислены их целевая функция:

Equation1

Определяется как:

Equation2

где Xmax = 1,0, thetaMax = pi / 6, _X'max = 1,0, theta'Max = 3,0, N - количество шагов итерации, T = 0,02 * TS и Wk - выбранные положительные веса. (Однако, используя определенные значения для углов, скоростей и положений из бумаги, вы захотите использовать свои собственные значения в зависимости от граничных условий вашего маятника).

В документе также говорится, что первый и второй члены определяют накопленную сумму нормализованных абсолютных отклонений X1 и X3 от нуля, а третий член при минимизации максимизирует время выживания.

Этого должно быть более чем достаточно для начала, но я НАСТОЯТЕЛЬНО рекомендую вам прочитать всю статью. Это отличное чтение, и я нашел его довольно познавательным.

Вы можете создать свою собственную фитнес-функцию, но я думаю, что идея использования положения, скорости, угла и скорости изменения угла, под которым маятник, является хорошей идеей для фитнес-функции. Однако вы можете использовать эти переменные совершенно иначе, чем тот, который автор статьи выбрал для моделирования их функции.

Не помешало бы также почитать о гармонических осцилляторах. Они имеют общий вид:

m x + B x '-k x = A cos (w * t)

(где B или A могут быть 0 в зависимости от того, является ли осциллятор демпфированным / незатухающим или ведомым / не приводимым соответственно).

person Grant Williams    schedule 12.03.2015
comment
Большое спасибо за ваш ответ, я также попытался максимально увеличить продолжительность балансировки шеста, но не нашел, как заставить тележку двигаться в пределах границ пути ... любыми способами, я попробую применить эту статью, которую я вижу что происходит - person user1931907; 13.03.2015