Кто прав? Менеджер или владелец ресторана?

Новогодняя неделя встречает людей в праздничном настроении. Люди обычно любят обедать со своими близкими. Менеджер очень популярного ресторана "Dine Out" утверждает, что во все дни первой недели нового года должна быть такая же толпа. Хотя владелец ресторана, исходя из своего прошлого опыта в ресторанном бизнесе, утверждает, что это не так, и посещаемость / толпа в одни дни будут сильно отличаться от других.

После первой недели нового года мы наблюдали, какова была массовая посещаемость в те дни. Данные выглядят так:

Глядя на данные, кажется, что Владелец прав, 1 и 2 января собираются больше людей, чем в другие дни.

Но насколько статистически мы уверены, что толпа в один день недели сильно отличается от других дней? Насколько вероятно появление такого типа данных? Если мы хотим быть уверены на 90% или на уровне значимости (α = 0,10), что когда-то работало иначе, чем другие, какова будет ваша стратегия?

Стратегия

Давайте создадим схему проверки гипотез для проблемы, определив нулевую и альтернативную гипотезы.

  • H₀: все дни работают одинаково
  • Х: одни дни работают иначе, чем другие.

Мы будем использовать статистику хи-квадрат (χ2) для проверки гипотезы.

Статистика хи-квадрат (χ2) - это тест, который измеряет, насколько ожидания сравниваются с фактическими наблюдаемыми данными (или результатами модели). Данные, используемые при вычислении статистики хи-квадрат, должны быть случайными, необработанными, взаимоисключающими, взятыми из независимых переменных и взятыми из достаточно большой выборки. Например, этим критериям соответствуют результаты подбрасывания монеты 100 раз. [[Источник Investopedia]]

Формула для статистики хи-квадрат дается как -

где c - степень свободы, O - наблюдаемое значение, а E - ожидаемое значение.

Теперь, если мы предположим, что нулевая гипотеза верна, тогда все дни работают одинаково. Таким образом, общая недельная толпа будет равномерно распределяться каждый день с вероятностью 1/7. Давайте создадим таблицу ожидаемого и наблюдаемого значения.

Вычисляя значение χ2,

χ2 = (145–123,14) ² / (123,14) +… + (120–123,14) ² / 123,14 = 5,96 & степеней свободы = 7–1 = 6

Далее мы можем взглянуть на χ2-таблицу или χ2-калькулятор.

Вероятность наблюдения таких экстремальных значений составляет 0,43 ›Уровень значимости α = 0,10. Таким образом, мы не можем отвергнуть нулевую гипотезу.

Заключение

Статистически мы можем сделать вывод, что у нас недостаточно доказательств, чтобы отвергнуть нулевую гипотезу. Таким образом, мы выступаем в пользу менеджера, который все дни первой недели нового года видит хорошую и одинаковую толпу.

Мой канал Youtube для получения дополнительной информации:



Об авторе:

Абхишек Мунголи (Abhishek Mungoli) - опытный специалист в области данных с опытом работы в области машинного обучения, со специализацией в области компьютерных наук, охватывающей различные области и способ решения проблем. Отлично разбирался в различных задачах машинного обучения и оптимизации, характерных для розничной торговли. С энтузиазмом относятся к масштабному внедрению моделей машинного обучения и обмену знаниями через блоги, выступления, встречи, публикации и т. Д.

Мой мотив всегда - упростить самые сложные вещи до их наиболее упрощенной версии. Мне нравится решение проблем, наука о данных, разработка продуктов и масштабные решения. Я люблю исследовать новые места и заниматься спортом в свободное время. Подпишитесь на меня в Medium, Linkedin или Instagram и посмотрите мои предыдущие сообщения. Приветствую отзывы и конструктивную критику. Некоторые из моих блогов -