Стандартные ошибки дифференциальной эволюции

Можно ли рассчитать стандартные ошибки дифференциальной эволюции?

Из статьи в Википедии:

http://en.wikipedia.org/wiki/Differential_evolution

Он не основан на производных (действительно, это одна из его сильных сторон), но как тогда рассчитать стандартные ошибки?

Я бы подумал, что какая-то стратегия начальной загрузки может быть применима, но, похоже, не могу найти никаких источников, кроме применения начальной загрузки к DE?

Баз


person Bazman    schedule 04.07.2014    source источник


Ответы (1)


Что касается стандартных ошибок, дифференциальная эволюция аналогична любой другой эволюционный алгоритм.

Использование стратегии начальной загрузки кажется хорошей идеей: обычные формулы предполагают нормальное (гауссово) распределение базовых данных. Это почти никогда не верно для эволюционных вычислений (гораздо более распространены экспоненциальные распределения, за которыми, вероятно, следуют бимодальные распределения).

самый простой метод начальной загрузки включает в себя взятие исходного набора данных из N чисел и выборку из него для формирования новой выборки (повторная выборка), которая также имеет размер N. Повторная выборка берется из исходной с использованием выборки с замена. Этот процесс повторяется большое количество раз (обычно 1000 или 10000 раз), и для каждой из этих выборок начальной загрузки мы вычисляем ее среднее/медиану (каждая из них называется оценками начальной загрузки).

Используйте исходную выборку для представления совокупности. Возьмите повторные повторные выборки из порядковой выборки. Используйте эти повторные выборки для расчета  оценка статистики населения (среднее или медиана)

Стандартное отклонение (SD) средних значений — это стандартная ошибка (SE) среднего значения, а SD медиан – SE медианы с начальной коррекцией (2,5 й и 97,5-й центили средних значений являются начальными 95% доверительными пределами для среднего значения).

Предупреждения:

  • слово популяция используется в разных значениях в разных контекстах (самозагрузка или эволюционный алгоритм).
  • в любой GA или GP среднее значение населения почти ничего интересного вам не говорит. Используйте среднее/медиану наилучшего результата
  • среднее значение набора, который не имеет нормального распределения, дает значение, которое ведет себя неинтуитивно. Особенно, если распределение вероятностей асимметрично: большие значения в «хвосте» могут доминировать, а среднее имеет тенденцию отражать типичное значение «наихудших» данных, а не типичное значение данных в целом. В этом случае лучше медиана

Некоторые интересные ссылки:

person manlio    schedule 24.09.2014