В науке о данных мы сталкиваемся с такими терминами, как среднее, мода, медиана, дисперсия, стандартное отклонение и многими другими. Эти арифметические функции очень полезны для решения задач науки о данных. Давайте разберемся в них подробнее.

Что это означает?

Среднее — это среднее число. По сути, это сумма всех чисел, деленная на их количество.

Пример: у нас есть следующие числа: 2 , 3 , 4 и 7.

Первый шаг: сумма всех чисел: 2 + 3 + 4 + 7 = 16
Второй шаг: общее количество чисел в ряду: 4
Третий шаг: Разделите сумму всех чисел на общее количество чисел в ряду. ряд: 16/4=4

Таким образом, мы получаем среднее значение равное 4.

Что такое режим?

Число, которое чаще всего встречается в заданном наборе чисел, называется модой.

В приведенном выше ряду чисел у нас есть номер 4 в качестве режима, поскольку он встречается максимальное время, то есть 5 раз.

Что такое медиана?

Медиана — это середина отсортированного списка чисел.

Для этого у нас будет два примера, так как мы будем часто сталкиваться с ними обоими, пытаясь найти медиану.

Пример: 1

список чисел: (3, 6, 1, 2, 4, 5, 7)

Сначала рассортируем их по порядку: (1, 2, 3, 4, 5, 6, 7)

Здесь мы получаем 4 в качестве медианы, поскольку она находится точно посередине.

Пример: 2

Что, если мы добавим еще одно число в список чисел. Мы не получаем ни одного среднего числа, но мы получаем пару средних чисел. Давайте посмотрим, как это решить.

список чисел: (3, 6, 1, 2, 4, 5, 7, 8)

Сначала рассортируем их по порядку: (1, 2, 3, 4, 5, 6, 7, 8)

Здесь мы получаем пару средних чисел 4 и 5. Чтобы найти точную середину, мы складываем оба числа и делим на 2.

Медиана = (4 + 5) / 2 = 4,5

Значит медиана 4,5

Что такое дисперсия?

Дисперсия связана как со средним, так и со стандартным отклонением. Дисперсия может быть определена как среднее квадратов отличий от среднего.

Давайте рассмотрим это шаг за шагом:

1. Сначала мы вычисляем среднее значение. Среднее, как вы знаете, является средним значением чисел.
2. Затем для каждого числа: вычтите его из среднего и возведите результат в квадрат.
3. Затем вычислите среднее значение этой разницы.

Пример. Предположим, у нас есть высота разных зданий в метрах: ( 10, 15, 20, 10, 25 )

Сначала вычисляем среднее значение: (10, 15, 20, 10, 25) / 5 = 16.

Затем мы вычисляем отличие каждого числа от среднего, возводим его в квадрат, а затем усредняем результат. Конечным результатом является дисперсия.

Дисперсия = (10–16)² + (15–16)² + (20–16)² + (10–16)² + (25–16)² / 5
= 36 + 1 + 16 + 1 + 81 / 5
= 135 / 5
= 27

Что такое стандартное отклонение?

Стандартное отклонение — это просто квадратный корень из дисперсии.

Таким образом, будет: Квадратный корень ( 27 ) = 5,196

Стандартное отклонение очень полезно. Теперь мы можем узнать высоту зданий, которые находятся в пределах одного стандартного отклонения (5,196 м) от среднего значения.

Благодаря этому мы узнаем, какие здания имеют нормальную высоту, а какие слишком большие или слишком маленькие.

Надеюсь, вы познакомились с некоторыми арифметическими терминами, которые мы будем часто использовать при решении задач науки о данных.

Первоначально опубликовано наhttps://www.readsmarty.com/2020/07/what-is-mean-mode-median-variance-and.html