Недавно Джереми Ховард и его команда выпустили несколько уроков из серии Практическое глубокое обучение для кодеров 2022. На протяжении многих лет мне нравилось, как он слушал некоторые из его выступлений и читал некоторые его материалы. Хотя я уже прошел свою часть лекций и курсов, связанных с ML, я решил пройти его Серию лекций и книгу 2022 года в качестве своего рода переподготовки.
Я буду писать о некоторых из моих ключевых выводы из каждой главы.
Тема этики ИИ довольно сложна и действительно заинтересовала меня, когда я начал больше читать об этих темах. Думаю, в будущем я посвятю еще одну независимую серию блогов на эту тему.
Обращение за помощью и подотчетность
Принятие на себя ответственности за понимание потенциала модели в «дикой природе» и разработка мероприятий по аудиту поведения модели.
Петли обратной связи
Интересный феномен, в котором модель может выступать как собственное «самосбывающееся пророчество». Когда решения принимаются на основе результатов модели, и эти решения изменяют данные, которые используются для модели в следующий раз.
Когда у алгоритма есть метрика для оптимизации, как вы видели, он сделает все возможное, чтобы оптимизировать это число. Это, как правило, приводит ко всевозможным пограничным случаям, и люди, взаимодействующие с системой, будут искать, находить и использовать эти пограничные случаи и петли обратной связи в своих интересах.
Предвзятость
То, как мы, люди, воспринимаем мир и осмысляем его, принципиально требует от нас навязывания собственных предубеждений. Во всех аспектах жизни мы склонны маркировать и классифицировать вещи, используя порядок, чтобы упростить и осмыслить наше окружение. В некотором смысле предвзятость неизбежна. Но мы можем сделать все возможное, чтобы максимизировать наше восприятие мира и расширение точек зрения.
Историческая погрешность. Авторы отмечают, что любые данные о людях на уровне набора данных имеют историческую погрешность. Просто потому, что люди исторически относились друг к другу с предубеждением.
Смещение представления: чрезмерное или недостаточное представление распределения населения в данных.
Смещение измерения: неверная или неточная информация, включенная в модель, приводит к вводящим в заблуждение результатам.
Смещение агрегирования: когда различные условные распределения в данных не учитываются при агрегировании.
Смещение оценки. Смещение в контрольных показателях производительности модели?
Предвзятость развертывания:предвзятость в интерпретации результатов и постобработке.
Не существует прямого метода борьбы с любым из этих предубеждений, каждое зависит от контекста. Лучше всего проявлять осмотрительность и осознавать их существование, а затем предпринимать необходимые действия.
Дезинформация
В медийной риторике я часто слышал, что термины дезинформация и дезинформация используются достаточно часто, но никогда толком не исследовал, что они на самом деле означают. Определения Dictionary.com следующие:
Дезинформация: ложная информация, которая распространяется независимо от намерения ввести в заблуждение.
Дезинформация: заведомо вводящая в заблуждение или предвзятая информация; манипулируемое повествование или факты; пропаганда.
Авторы отмечают, что дезинформация часто может содержать семена правды, но вырванные из контекста. Возможно, небольшая правда усложняет отделение фактов от вымысла. Были выдвинуты различные решения о том, как бороться с дезинформацией. Авторы предлагают систему проверки в качестве барьера для входа в производство контента.
Рене ДиРеста предложила интересную схему борьбы с дезинформацией. Она разбивает решение на 3 категории: удалить, уменьшить и сообщить.
Удалить — контент или учетная запись удалены (иногда действительны, но могут быть использованы не по назначению).
Информирование — проверка фактов или маркировка (существенное отставание по сравнению с быстрым производством контента, недоверие к проверяющим фактам).
Уменьшить — добавление трения к скорости распространения контента, что позволяет выполнить шаг «Информирование».