В науке о данных мы сталкиваемся с такими терминами, как среднее, мода, медиана, дисперсия, стандартное отклонение и многими другими. Эти арифметические функции очень полезны для решения задач науки о данных. Давайте разберемся в них подробнее.
Что это означает?
Среднее — это среднее число. По сути, это сумма всех чисел, деленная на их количество.
Пример: у нас есть следующие числа: 2 , 3 , 4 и 7.
Первый шаг: сумма всех чисел: 2 + 3 + 4 + 7 = 16
Второй шаг: общее количество чисел в ряду: 4
Третий шаг: Разделите сумму всех чисел на общее количество чисел в ряду. ряд: 16/4=4
Таким образом, мы получаем среднее значение равное 4.
Что такое режим?
Число, которое чаще всего встречается в заданном наборе чисел, называется модой.
В приведенном выше ряду чисел у нас есть номер 4 в качестве режима, поскольку он встречается максимальное время, то есть 5 раз.
Что такое медиана?
Медиана — это середина отсортированного списка чисел.
Для этого у нас будет два примера, так как мы будем часто сталкиваться с ними обоими, пытаясь найти медиану.
Пример: 1
список чисел: (3, 6, 1, 2, 4, 5, 7)
Сначала рассортируем их по порядку: (1, 2, 3, 4, 5, 6, 7)
Здесь мы получаем 4 в качестве медианы, поскольку она находится точно посередине.
Пример: 2
Что, если мы добавим еще одно число в список чисел. Мы не получаем ни одного среднего числа, но мы получаем пару средних чисел. Давайте посмотрим, как это решить.
список чисел: (3, 6, 1, 2, 4, 5, 7, 8)
Сначала рассортируем их по порядку: (1, 2, 3, 4, 5, 6, 7, 8)
Здесь мы получаем пару средних чисел 4 и 5. Чтобы найти точную середину, мы складываем оба числа и делим на 2.
Медиана = (4 + 5) / 2 = 4,5
Значит медиана 4,5
Что такое дисперсия?
Дисперсия связана как со средним, так и со стандартным отклонением. Дисперсия может быть определена как среднее квадратов отличий от среднего.
Давайте рассмотрим это шаг за шагом:
1. Сначала мы вычисляем среднее значение. Среднее, как вы знаете, является средним значением чисел.
2. Затем для каждого числа: вычтите его из среднего и возведите результат в квадрат.
3. Затем вычислите среднее значение этой разницы.
Пример. Предположим, у нас есть высота разных зданий в метрах: ( 10, 15, 20, 10, 25 )
Сначала вычисляем среднее значение: (10, 15, 20, 10, 25) / 5 = 16.
Затем мы вычисляем отличие каждого числа от среднего, возводим его в квадрат, а затем усредняем результат. Конечным результатом является дисперсия.
Дисперсия = (10–16)² + (15–16)² + (20–16)² + (10–16)² + (25–16)² / 5
= 36 + 1 + 16 + 1 + 81 / 5
= 135 / 5
= 27
Что такое стандартное отклонение?
Стандартное отклонение — это просто квадратный корень из дисперсии.
Таким образом, будет: Квадратный корень ( 27 ) = 5,196
Стандартное отклонение очень полезно. Теперь мы можем узнать высоту зданий, которые находятся в пределах одного стандартного отклонения (5,196 м) от среднего значения.
Благодаря этому мы узнаем, какие здания имеют нормальную высоту, а какие слишком большие или слишком маленькие.
Надеюсь, вы познакомились с некоторыми арифметическими терминами, которые мы будем часто использовать при решении задач науки о данных.
Первоначально опубликовано наhttps://www.readsmarty.com/2020/07/what-is-mean-mode-median-variance-and.html