Диапазон — это не что иное, как разница между максимальным значением и минимальным значением. Он говорит нам, в каком диапазоне лежит весь набор данных. Диапазон очень легко и просто рассчитать, но в то же время он слишком чувствителен к выбросам.
R = max(набор данных) -min(набор данных)
Дисперсия:
Дисперсия — это мера разброса данных, это математическое ожидание квадрата отклонения случайной величины от ее среднего значения.
Теперь давайте попробуем понять интуитивно, не слишком углубляясь в математику, почему мы делим на «n-1», а не на «n».
Идеальным способом расчета стандартного отклонения от выборочного набора данных был бы
Но мы не знаем «мю», поэтому вместо этого используем «х-бар». «x-bar» рассчитывается с использованием только выборочного набора данных, поэтому в реальном мире
следовательно,
Следовательно, мы используем «n-1» в знаменателе для расчета несмещенного стандартного отклонения от выборки.
Среднеквадратичное отклонение:
Поскольку единицей дисперсии является квадрат единицы данных (как видно из приведенной выше формулы), значение дисперсии не очень интуитивно понятно, поэтому мы берем ее квадратный корень, который определяется как стандартное отклонение.
- Если стандартное отклонение мало, данные имеют небольшой разброс (т. е. большинство точек находятся очень близко к среднему).
- Если стандартное отклонение = 0, разброс отсутствует. Это происходит только тогда, когда все элементы данных имеют одинаковое значение.
- На стандартное отклонение существенно влияют выбросы и асимметричные распределения.
Спасибо за прочтение статьи! Хотите связаться со мной?
Вот ссылка на мой профиль LinkedIn