Что такое дисперсия и ее меры ?

Диапазон — это не что иное, как разница между максимальным значением и минимальным значением. Он говорит нам, в каком диапазоне лежит весь набор данных. Диапазон очень легко и просто рассчитать, но в то же время он слишком чувствителен к выбросам.

R = max(набор данных) -min(набор данных)

Дисперсия:

Дисперсия — это мера разброса данных, это математическое ожидание квадрата отклонения случайной величины от ее среднего значения.

Теперь давайте попробуем понять интуитивно, не слишком углубляясь в математику, почему мы делим на «n-1», а не на «n».
Идеальным способом расчета стандартного отклонения от выборочного набора данных был бы

Но мы не знаем «мю», поэтому вместо этого используем «х-бар». «x-bar» рассчитывается с использованием только выборочного набора данных, поэтому в реальном мире

следовательно,

Следовательно, мы используем «n-1» в знаменателе для расчета несмещенного стандартного отклонения от выборки.

Среднеквадратичное отклонение:

Поскольку единицей дисперсии является квадрат единицы данных (как видно из приведенной выше формулы), значение дисперсии не очень интуитивно понятно, поэтому мы берем ее квадратный корень, который определяется как стандартное отклонение.

Если стандартное отклонение мало, данные имеют небольшой разброс (т. е. большинство точек находятся очень близко к среднему).
Если стандартное отклонение = 0, разброс отсутствует. Это происходит только тогда, когда все элементы данных имеют одинаковое значение.
На стандартное отклонение существенно влияют выбросы и асимметричные распределения.

Спасибо за прочтение статьи! Хотите связаться со мной?
Вот ссылка на мой профиль LinkedIn

Санкет Кэнгл — инженер-программист — Apisero Inc. | LinkedIn
Технический и стратегический специалист с искусственным интеллектом, облачной специализацией и Mulesoft-API с…www.linkedin.com

Что такое дисперсия и ее меры ?

Дисперсия:

Среднеквадратичное отклонение:

Похожие вопросы