Недавно Джереми Ховард и его команда выпустили несколько уроков из серии Практическое глубокое обучение для кодеров 2022. На протяжении многих лет мне нравилось, как он слушал некоторые из его выступлений и читал некоторые его материалы. Хотя я уже прошел свою часть лекций и курсов, связанных с ML, я решил пройти его Серию лекций и книгу 2022 года в качестве своего рода переподготовки.

Я буду писать о некоторых из моих ключевых выводы из каждой главы.

Тема этики ИИ довольно сложна и действительно заинтересовала меня, когда я начал больше читать об этих темах. Думаю, в будущем я посвятю еще одну независимую серию блогов на эту тему.

Обращение за помощью и подотчетность

Принятие на себя ответственности за понимание потенциала модели в «дикой природе» и разработка мероприятий по аудиту поведения модели.

Петли обратной связи

Интересный феномен, в котором модель может выступать как собственное «самосбывающееся пророчество». Когда решения принимаются на основе результатов модели, и эти решения изменяют данные, которые используются для модели в следующий раз.

Когда у алгоритма есть метрика для оптимизации, как вы видели, он сделает все возможное, чтобы оптимизировать это число. Это, как правило, приводит ко всевозможным пограничным случаям, и люди, взаимодействующие с системой, будут искать, находить и использовать эти пограничные случаи и петли обратной связи в своих интересах.

Предвзятость

То, как мы, люди, воспринимаем мир и осмысляем его, принципиально требует от нас навязывания собственных предубеждений. Во всех аспектах жизни мы склонны маркировать и классифицировать вещи, используя порядок, чтобы упростить и осмыслить наше окружение. В некотором смысле предвзятость неизбежна. Но мы можем сделать все возможное, чтобы максимизировать наше восприятие мира и расширение точек зрения.

Историческая погрешность. Авторы отмечают, что любые данные о людях на уровне набора данных имеют историческую погрешность. Просто потому, что люди исторически относились друг к другу с предубеждением.

Смещение представления: чрезмерное или недостаточное представление распределения населения в данных.

Смещение измерения: неверная или неточная информация, включенная в модель, приводит к вводящим в заблуждение результатам.

Смещение агрегирования: когда различные условные распределения в данных не учитываются при агрегировании.

Смещение оценки. Смещение в контрольных показателях производительности модели?

Предвзятость развертывания:предвзятость в интерпретации результатов и постобработке.

Не существует прямого метода борьбы с любым из этих предубеждений, каждое зависит от контекста. Лучше всего проявлять осмотрительность и осознавать их существование, а затем предпринимать необходимые действия.

Дезинформация

В медийной риторике я часто слышал, что термины дезинформация и дезинформация используются достаточно часто, но никогда толком не исследовал, что они на самом деле означают. Определения Dictionary.com следующие:

Дезинформация: ложная информация, которая распространяется независимо от намерения ввести в заблуждение.

Дезинформация: заведомо вводящая в заблуждение или предвзятая информация; манипулируемое повествование или факты; пропаганда.

Авторы отмечают, что дезинформация часто может содержать семена правды, но вырванные из контекста. Возможно, небольшая правда усложняет отделение фактов от вымысла. Были выдвинуты различные решения о том, как бороться с дезинформацией. Авторы предлагают систему проверки в качестве барьера для входа в производство контента.

Рене ДиРеста предложила интересную схему борьбы с дезинформацией. Она разбивает решение на 3 категории: удалить, уменьшить и сообщить.

Удалить — контент или учетная запись удалены (иногда действительны, но могут быть использованы не по назначению).

Информирование — проверка фактов или маркировка (существенное отставание по сравнению с быстрым производством контента, недоверие к проверяющим фактам).

Уменьшить — добавление трения к скорости распространения контента, что позволяет выполнить шаг «Информирование».