Извлекая уроки из проблем конфиденциальности данных DeepMind

Это перепечатка (более или менее) ежедневного информационного бюллетеня ARCHITECHT за понедельник. Зарегистрируйтесь здесь, чтобы получать его в свой почтовый ящик каждое утро.

Вы определенно захотите обратить внимание на последние новости из продолжающейся саги о Google DeepMind и правительственном органе по контролю за данными о потребителях, Управлении комиссара по информации. Большой новостью в понедельник стало то, что ICO подтвердило, что DeepMind и Национальная служба здравоохранения Великобритании действительно нарушили законы о конфиденциальности данных в соглашении, которое они заключили в 2015 году.

Я писал об этом расследовании еще в марте, и вы можете получить более подробную информацию в том посте, а также здесь:

Регулятор данных Великобритании говорит, что первоначальная сделка DeepMind с NHS нарушила закон о конфиденциальности (TechCrunch) (я бы начал здесь, чтобы быстро и легко узнать подробности)
Сделка Google DeepMind с данными NHS «не соответствует закону» (New Scientist)
Google DeepMind и здравоохранение в эпоху алгоритмов (Health Care Technology)

Коротко говоря, DeepMind заключила соглашения о доступе к данным пациентов из больниц, чтобы обучить модель, которая может предсказывать проблемы с почками и отправлять сообщения врачам и медсестрам в режиме реального времени. Правительство обнаружило, что больницы предоставили DeepMind больше данных, чем было необходимо, и что DeepMind использовала данные способами, которые не были раскрыты в соглашениях.

Тем не менее, вы также захотите прочитать вину DeepMind — и провозглашение успеха проекта — по этому конкретному вопросу: Уполномоченный по информации, Royal Free и чему мы научились. Что DeepMind узнал, так это то, что он в значительной степени упустил из виду сложности и обоснования законов о конфиденциальности данных потребителей, но также и то, что его технология Streams работает очень хорошо:

«Мы гордимся тем, что через несколько недель после развертывания Streams в Royal Free медсестры сказали, что это экономит им до двух часов каждый день, и мы уже слышали о случаях, когда пациентов с серьезными заболеваниями выявляли быстрее. благодаря мгновенным оповещениям. Поскольку Streams разработан, чтобы быть готовым к использованию более передовых технологий в будущем, включая клинические оповещения на основе искусственного интеллекта, мы надеемся, что со временем он поможет принести еще больше преимуществ пациентам и врачам».

ICO также опубликовало заявление в блоге, в котором, по сути, объясняется, что правила конфиденциальности необходимы и не являются препятствием для инноваций: Четыре урока, которые NHS Trusts может извлечь из дела Royal Free.

Предстоит еще много работы по вопросу конфиденциальности данных и искусственного интеллекта в США, Великобритании и, я полагаю, во всем мире. С другой стороны, ИИ удивительно хорошо различает закономерности в медицинских данных и медицинских изображениях, и чем больше данных, тем лучше. С другой стороны, пациенты должны знать, что больницы не передают свои данные третьим лицам без их согласия, что потенциально делает их доступными для злоумышленников.

Матей Захария, один из создателей Apache Spark и соучредителей Databricks, также затронул эту проблему в недавнем интервью подкаста ARCHITECHT Show. Он работает над проектом DAWN в Стэнфорде, одной из целей которого является упрощение обработки обучающих данных для моделей ИИ, особенно в таких областях, как медицина или другие отрасли, где данные трудно получить и еще сложнее (или дороже) классифицировать:

«Но что, если вы пытаетесь анализировать медицинские записи и автоматически ставить диагнозы? Вы не можете размещать медицинские записи людей в Интернете, чтобы случайные люди могли их пометить. … Даже если бы вы могли, вам нужны врачи, чтобы пометить их. Так что… это стоит 200 долларов в час или больше».

Позже в интервью он добавил:

«Если вы посмотрите, например, на программное обеспечение, выпускаемое Google, оно действительно оптимизировано для компании в стиле Google. Они используют это внутренне. Это компания, в которой все приложения находятся в Интернете, поэтому данных очень много. …

«…Если программа дает отличные результаты, это здорово, но это не значит, что она действительно подходит для, скажем, медицинского исследователя из Стэнфордского госпиталя, у которого нет 20 000 докторских диссертаций и миллионов помеченных изображений. . На самом деле для них это совсем другая проблема. “

Такие проекты, как DAWN, пытаются исправить эту ситуацию, упрощая процесс классификации. Исследователи ИИ работают над сокращением объема данных, которые их модели должны точно изучить, а также над созданием смоделированных данных, которые могут помочь в обучении моделей там, где не хватает реальных данных.

Но это проблема, которая не исчезнет в ближайшее время, по крайней мере, в том, что касается компаний. Существует разрыв между законами, финансовыми стимулами и типами компаний/организаций, собирающих данные о потребителях, а также тем, что они собирают. Например, для каждой больницы есть поставщик медицинских приложений или другая технологическая компания, которая хотела бы получить доступ к своим данным, и наоборот. И, как указывает DeepMind, польза для пациентов и персонала больницы может быть значимой — даже если кому-то пришлось нарушить некоторые правила, чтобы это сделать.

Умные люди уже давно призывают к каким-то действиям по подобным вопросам — правилам, уравновешивающим конфиденциальность, инновации, анонимность и безопасность, — но рассвет эры искусственного интеллекта кажется подходящим временем, чтобы действительно что-то сделать.

Слушайте последний подкаст ARCHITECT AI

Шоу ИИ и роботов, эпизод. 3: Риши Бхаргава (Демисто)

architechtshow.com

В этом эпизоде шоу ARCHITECHT AI and Robot Show Деррик Харрис беседует с соучредителем Demisto Риши Бхаргавой о состоянии кибербезопасности и о том, как машинное обучение может помочь навести порядок в хаосе. Бхаргава обсуждает текущие направления угроз и недостатки многих тактик реагирования, а также объясняет, как технология Demisto использует ChatOps для анализа поведения при реагировании, предлагает варианты действий и предоставляет сотрудникам службы безопасности единую точку взаимодействия с десятками инструментов.

Искусственный интеллект

Mendel.ai собирает 2 миллиона долларов, чтобы помочь больным раком пройти последние клинические испытания

techcrunch.com

Это немного похоже на некоторые из ранних заявлений IBM о Watson, только сосредоточенных на клинических испытаниях, а не на исследовательской литературе. Это также одна из тех ситуаций, о которых говорилось выше, когда чем больше данных есть у каждой стороны, тем лучше она может работать.

Питер Норвиг о неопределенности в программировании ИИ

thenewstack.io

Это вдумчивый подход к различиям между созданием приложений ИИ и других приложений, вплоть до таких вопросов, как эффективная отладка системы.

Ник Бостром на пути ИИ и сверхразума

www.youtube.com

Это хорошая презентация Ника Бострома, который придумал термин (я думаю) «сверхразум». Он указывает на неопределенность в прогнозах относительно того, когда это произойдет, освещает некоторые проблемы и говорит, что он не так предсказывает гибель ИИ, как можно было бы предположить по его исследованиям.

Подробнее об исследованиях, чтобы понять, о чем думает ИИ

www.newscientist.com

Мы видели много работы по преодолению проблемы черного ящика в ИИ, включая основные моменты исследований в этой новости. Понимание того, почему принимаются решения, будет иметь решающее значение, поскольку ИИ выходит на регулируемые арены.

Как создатель Spark пытается демократизировать ИИ с помощью проекта DAWN
Матей Захария и Питер Бейлис о новом проекте Стэнфорда DAWN и упрощении ИИ с нуля.architecht. ио

Миссия Baidu завладеть рынком беспилотных автомобилей в Китае

www.reuters.com

На этой неделе компания собирается объявить о крупных партнерствах и новом программном обеспечении. Не делайте ставку на Baidu, чтобы создать серьезные волны в этом пространстве, особенно за границей.

Склады как полигон для автономных технологий

www.technologyreview.com

Независимо от того, переходят ли технологии со складов на дороги, трудно спорить с логикой, согласно которой складские роботы могут многому нас научить во взаимодействии между людьми и автономными машинами.

Сообщается, что Alibaba создает клон Echo

состояние.com

В основном это бизнес-история, а не история с ИИ, но вполне возможно, что распространение умных домашних помощников (включая Apple HomePod) научит нас тому, что на самом деле ценят потребители.

Еще один взгляд на подделку голоса с помощью ИИ

www.wired.com

Я связался с сообщением в блоге об этом пару месяцев назад, и вот еще один взгляд на эту тему. Я бы сказал, что эта практика кажется осуществимой через несколько лет, но не вызывает особого беспокойства в больших масштабах.

В защиту IBM Watson
Что, если Watson в конечном итоге оправдает шумиху, а все его критики в конечном итоге съедят ворону?architecht.io

Исследователи Disney удаляют анимационный шум с помощью глубокого обучения

www.disneyresearch.com

В компьютерном зрении так много работы, что за ней трудно уследить — в том числе и для этого самого приложения — но я всегда обращаю внимание, когда в этом участвует Disney. Потому что это Дисней.

Предупреждение о том, что язык и текст означают совершенно разные вещи в других языках и культурах

www.thedroidssonroids.com

Технически это не касается ИИ, но применимо ко всем, кто работает с распознаванием текста или речи. Если вы продвигаете продукт по всему миру, убедитесь, что он понимает и приспособлен для разных культур.

DeepMind создает NoisyNet для ускорения обучения с подкреплением

arxiv.org

DeepMind действительно вывел обучение с подкреплением на первый план благодаря своим системам видеоигр, и это новое исследование направлено на то, чтобы сделать его еще лучше, предоставив системам новый способ изучения окружающей среды.

Еще один подход к созданию ИИ, который запоминает и учится

arxiv.org

Это может показаться нелогичным, но на самом деле системы ИИ не очень хорошо учатся на том, что они уже изучили. Это проблема, которая сейчас привлекает много внимания, в том числе со стороны этой команды в Карнеги-Меллон.

Облако и инфраструктура

Microsoft снова проводит реорганизацию и увольняет некоторое количество людей

www.zdnet.com

В других сообщениях говорится, что грядут тысячи увольнений, но Мэри Джо Фоули из ZDNet предполагает, что их число может быть намного меньше. В любом случае, они являются частью продолжающегося перехода компании к продаже облачных услуг и технологий.

Не забывайте, что у AWS появился новый сервис для колл-центров

www.allthingsdistributed.com

В этом сообщении в блоге технического директора Amazon Вернера Фогельса объясняется, почему новая интеграция между Amazon Lex (голосовой API) и AWS Connect (сервис колл-центра) настолько эффективна. Но чем больше я думаю о Connect и его последствиях, тем больше я думаю, что мы будем оглядываться на эту эпоху, как мы это делали, когда AWS перешла от книг к вычислениям.

5 уроков, как правильно делать open source

gcn.com

Это из публикации, предназначенной для государственных учреждений, но относится ко всем, кто использует программное обеспечение с открытым исходным кодом. Сообщество, поставщики и ваш собственный вклад будут иметь большое значение.

Блокчейн приходит на предприятие рядом с вами

spectrum.ieee.org

Блокчейн, очевидно, является одной из самых важных вещей, происходящих в технологиях прямо сейчас, но в этой статье предполагается, что технология будет выглядеть совсем по-другому через десятилетие, когда она действительно начнет становиться мейнстримом.

Связь между квантовыми вычислениями и облаком

soundcloud.com

В этом подкасте рассматриваются некоторые, на мой взгляд, хорошо понятные сегодня концепции, по крайней мере, на высоком уровне. А именно, квантовые вычисления должны будут охватывать облако, чтобы процветать, и знание этого с самого начала полезно для вовлеченных компаний.

Все данные

Посмотрите, как Alibaba думает о науке о данных для мирового господства

www.zdnet.com

В последнее время я ссылаюсь на множество историй об Alibaba, включая эту о том, как она рассматривает науку о данных как стратегическое преимущество. Я не думаю, что мы близки к тому, чтобы увидеть, насколько большой станет эта компания.

Как Кафка освоил однократную доставку сообщений

www.confluent.io

На прошлой неделе я связался с сообщением в блоге о том, как Segment использует это в своей службе интеграции данных, а затем я продолжал видеть, как оно появляется в других местах. Итак, вот информация и почему это важно прямо из Confluent.

Почему аналитика может быть сложным приложением для периферийных вычислений

www.dbms2.com

Здесь есть несколько справедливых замечаний о том, почему слишком рано считать само собой разумеющимся, что мы увидим тяжелые аналитические рабочие нагрузки, выполняемые на периферийных устройствах. Я думаю, что они, безусловно, будут, но будут ли они происходить на устройствах или в периферийных центрах обработки данных (до отправки в более широкое облако) — это большой вопрос.

Как стартап конвейера данных Astonomer использует DC/OS

www.astronomer.io

Совершенно случайно я впервые услышал об Astronomer на прошлой неделе, а затем увидел этот пост в блоге о том, как он использует DC/OS — технологию, которую я очень хорошо знаю. Это справедливая оценка его плюсов и минусов, особенно в качестве основы для платформы, ориентированной на данные.

Извлекая уроки из проблем конфиденциальности данных DeepMind

Слушайте последний подкаст ARCHITECT AI

Искусственный интеллект

Облако и инфраструктура

Все данные

Похожие вопросы