Диапазон — это не что иное, как разница между максимальным значением и минимальным значением. Он говорит нам, в каком диапазоне лежит весь набор данных. Диапазон очень легко и просто рассчитать, но в то же время он слишком чувствителен к выбросам.

R = max(набор данных) -min(набор данных)

Дисперсия:

Дисперсия — это мера разброса данных, это математическое ожидание квадрата отклонения случайной величины от ее среднего значения.

Теперь давайте попробуем понять интуитивно, не слишком углубляясь в математику, почему мы делим на «n-1», а не на «n».
Идеальным способом расчета стандартного отклонения от выборочного набора данных был бы

Но мы не знаем «мю», поэтому вместо этого используем «х-бар». «x-bar» рассчитывается с использованием только выборочного набора данных, поэтому в реальном мире

следовательно,

Следовательно, мы используем «n-1» в знаменателе для расчета несмещенного стандартного отклонения от выборки.

Среднеквадратичное отклонение:

Поскольку единицей дисперсии является квадрат единицы данных (как видно из приведенной выше формулы), значение дисперсии не очень интуитивно понятно, поэтому мы берем ее квадратный корень, который определяется как стандартное отклонение.

  • Если стандартное отклонение мало, данные имеют небольшой разброс (т. е. большинство точек находятся очень близко к среднему).
  • Если стандартное отклонение = 0, разброс отсутствует. Это происходит только тогда, когда все элементы данных имеют одинаковое значение.
  • На стандартное отклонение существенно влияют выбросы и асимметричные распределения.

Спасибо за прочтение статьи! Хотите связаться со мной?
Вот ссылка на мой профиль LinkedIn