В области машинного обучения матрица путаницы — это довольно распространенный термин, также известный как матрица ошибок, который позволяет нам визуализировать производительность модели классификации. Это имеет важное значение при анализе многих реальных проблем, и одна из тем, которую мы собираемся обсудить сегодня, — это кибербезопасность.

Итак, сначала познакомимся с термином

Что такое матрица путаницы?

Матрица путаницы — это матричное представление, которое часто используется для описания производительности модели классификации (или «классификатора»). Каждая строка матрицы Фактические экземпляры, а каждый столбец представляет экземпляры в прогнозируемом классе или наоборот. Однако для бинарной классификации есть только 2 возможных результата, разделяющих матрицу на 4 классификационных камеры.

  • Истинно положительный (TP): прогнозный результат +ve соответствует фактическому результату.
  • Истинно отрицательный (TN): где прогнозируемый результат равен -ve и соответствует фактическому результату.
  • Ложноположительный результат (FP): прогнозный результат — +ve, а фактический — —ve. Это более известно как ошибка типа I.
  • Ложноотрицательный(FN): где прогнозируемый результат равен -ve, а фактический результат равен +ve. Это более известно как ошибка типа II.

Теперь, когда у нас есть общее представление о том, что такое матрица путаницы, давайте обсудим ее наиболее характерные особенности, а именно ошибки типа I и типа II.

Давайте рассмотрим очень знакомый пример, чтобы понять это:

Мы все были там, где мы искали пиратский контент в Интернете, когда мы не можем заплатить за оригинальную работу, будь то фильмы, игры или какое-то программное обеспечение. Никогда не задумывались, почему все они, даже при загрузке с официального сайта, предлагают отключить антивирус перед установкой.

Что ж, предположим, вы инженер-программист, разработавший программу обнаружения вредоносных программ с искусственным интеллектом, точность которой составляет 98 %, что очень близко к идеалу. Дела идут хорошо, ваша модель действительно хороша и удаляет все подозрительные файлы, прежде чем они смогут нанести вред вашей системе. но вы, будучи инженером-программистом, имели много случайных файлов в вашей системе, которую вы создали. но ваш антивирус определяет эти файлы как вирусы и удаляет их с вашего ПК. в то время как на самом деле они были совершенно безопасны, Это ошибка типа I, также известная как ложное срабатывание.

С другой стороны, предположим, вы загрузили из Интернета несколько случайных пиратских программ, которые могли содержать какой-то вредоносный пакет, но ваша модель не смогла его обнаружить и выдала отчет False Negative, и ваша система была заражена. это ошибка типа II.

Обе эти ошибки чрезвычайно непредсказуемы и чрезвычайно опасны, но ложное срабатывание является более опасным и трудным для обработки. Ошибка типа II — это просто неспособность вашей модели обнаружить определенные результаты, которые можно улучшить с помощью оптимизации. Принимая во внимание, что ошибка типа I — это дополнительная (ненужная) точность вашей модели, которая может иметь неприятные последствия. Несмотря на то, что машинное обучение направлено на получение максимальной точности, это не всегда «лучшее» решение для получения наиболее точного ответа.

Причина, по которой большинство программ предполагает, что вы отключаете свои антивирусы, заключается в том, что ложные срабатывания некоторых антивирусов могут препятствовать установке этого программного обеспечения.

Но, с другой стороны, некоторые могут использовать эту лазейку для заражения вашей системы вредоносным ПО. Мало того, что киберпреступления могут быть в любой форме, включая кражу ваших данных, вашей личности, данных вашей карты и т. д. Вот почему всегда рекомендуется принимать необходимые меры предосторожности при работе с пиратскими материалами.