5 выводов из конференции Google I / O в этом году

Ранее в этом месяце я посетил Google I / O 2019. Это ежегодная конференция разработчиков, на которой объявляются о новых инновациях и продуктах Google за последний год. Также проходят интересные беседы мировых экспертов на самые разные темы, от творчества до будущего человечества. Вот пять моих главных выводов:

1. Google меняется

Внутри все меняется: сотрудники требуют прозрачности, справедливости в отношении неправомерных действий сексуального характера, а также того, чтобы Google прекратил создание поисковой системы с цензурой для Китая. (Подробно об этом подробно рассказывается в статье Fortune Внутри гражданской войны Google.) Есть также изменения, происходящие снаружи: пользователи требуют владения своими данными (и метаданными), прекращения сбора ненужных данных и многого другого.

Я знал все это, когда вошел в систему ввода-вывода Google, но основной доклад Сундара Пичаи дал понять, что Google реагирует на запросы пользователей. Он представил действия, которые компания предприняла, чтобы продемонстрировать свою приверженность конфиденциальности, среди прочего, такие как конфиденциальность умного дома с помощью Google Nest, усиление контроля над данными Карт и Ассистента и регулярное автоматическое удаление истории местоположений. .

Я рад этим изменениям, но они должны регулироваться государственной политикой. Пользователи в Европейском Союзе теперь могут запрашивать собранные о них данные в соответствии с их Общим регламентом защиты данных (GDPR). Нам нужно такое регулирование на глобальном уровне. Конфиденциальность - это право, а не привилегия, которую технологические компании могут предоставить.

Когда начался основной доклад, над Shoreline Ampitheatre неторопливо пролетел самолет, за которым последовал баннер с надписью «Контроль Google - это не конфиденциальность #SaveLocalNews». И это правда - Google сохраняет доступ к нашим данным и, несмотря на свою приверженность конфиденциальности, если эти данные не будут удалены безвозвратно, они останутся под контролем Google. Это не настоящая конфиденциальность.

Становится ясно, что люди требуют перемен, и когда над Googleplex летают самолеты ... трудно не слушать.

2. Доступность - это круто

Доступность всегда имела значение, и меня очень обрадовало то, что в основной речи она была поставлена в приоритет. В программном докладе был объявлен призыв к действию для Project Euphonia, попытки Google научить Google Assistant понимать всех .

Ассистент в его нынешнем виде не может понимать людей с нестандартной речью, а это большая часть населения мира: от людей с разными акцентами до людей с дефектами речи. Дмитрий Каневский, российский научный сотрудник Google, выучил английский после того, как потерял слух, поэтому его речь трудна для понимания. Он обучил ИИ-помощника тысячам звуковых байтов своей речи, чтобы определить, можно ли научить его понимать его - и это было так. Чтобы продолжить эту работу, Google призвал людей с нестандартной речью отправлять голосовые записи, чтобы разнообразить наборы данных для модели распознавания речи Ассистента. Если у вас есть нестандартная речь, которую вы хотите передать, подумайте о заполнении этой формы.

В дополнение к этому, в Android появилось еще две специальные возможности, которые меня очень радуют:

LiveCaption позволяет в реальном времени добавлять субтитры к речи, аудио и видео на устройствах Android.
LiveRelay позволяет пользователям с нарушениями слуха вести телефонные разговоры путем преобразования речи в текст и наоборот в режиме реального времени.

Обе функции выполняются на устройстве без подключения к Интернету и, следовательно, с минимальной задержкой. Это имеет огромный потенциал для людей с нарушениями слуха, и я уверен, что его можно будет найти и в других приложениях.

3. Создавайте дизайн вне себя

Когда мне было 10, мой отец принес домой кучу коробок, и мы с сестрами наблюдали, как он настраивал наш персональный компьютер, как будто это была мебель Ikea. Когда мне было 17, я наконец убедил родителей подарить мне мой первый сотовый телефон. Как я обнаружил на сеансе, посвященном следующему миллиарду пользователей технологий, эта траектория является отклонением.

Это имеет смысл. Быстрый запрос WolframAlpha говорит мне, что на Канаду приходится около 0,485% населения мира (по состоянию на 2017 год). Следующий миллиард пользователей определенно не из Канады.

Они есть в Азии и Африке. 50% пользователей смартфонов находятся в Азии, и Азия также является крупнейшим растущим рынком смартфонов. В отличие от меня, эти пользователи настроены исключительно на мобильные устройства, часто практически не имея доступа к персональным компьютерам или планшетам и т. Д. Сотовый телефон - их единственное устройство. Когда я начал писать это, я перешел со смартфона на ноутбук, чтобы упростить работу с большими пальцами. Этот сценарий недоступен для этого рынка, и дизайнеры и разработчики должны это понимать. Мобильные приложения и мобильные веб-сервисы должны быть полностью функциональными, а не просто сопутствующими продуктами.

Многие из этих пользователей взаимодействуют со своим телефоном с помощью голоса. 30% пользователей в Индии выполняют поиск в основном с помощью голоса. Разработчикам необходимо подумать о том, насколько хорошо они поддерживают этот тип использования, и, кроме того, может ли используемая ими голосовая технология действительно понять этих пользователей.

Им нужен локализованный контент - не просто переведенный, а адаптированный и оригинальный контент для их языка. Только в Нигерии говорят на 520 языках. В Индии 23 официальных языка и 13 официальных алфавитов. Несмотря на то, что хинди является четвертым по распространенности языком в мире, он даже не входит в 30 лучших языков для веб-контента. Ожидание, что эти пользователи будут знать английский, подвергнет остракизму огромный рынок.

Если вы хотите, чтобы эти следующие миллионы пользователей стали вашими пользователями, вам нужно учитывать их при проектировании.

4. Машинное обучение уже присутствует во всем

Может, это меня просто шокировало. Думаю, мне никогда не приходило в голову, насколько органично встроены машинное обучение и искусственный интеллект почти в каждый сервис Google (не говоря уже о продуктах Facebook или Microsoft). Ассистент понимает меня с помощью обученных моделей машинного обучения, Новости Google знают, что мне нравится, и показывают новости, которые меня интересуют, а Google Фото может найти все фотографии в моей коллекции, отмеченные «золотым кольцом», если я попросю. Думаю, вы, наверное, все это знали.

Все модели машинного обучения Ассистента теперь можно сжать до 0,5 ГБ и сохранить на мобильном устройстве, работая в автономном режиме. Это впечатляет. ML буквально во всем.

Я посетил несколько сессий, посвященных моделированию машинного обучения, разработке и приложениям в музыке. TensorFlow - это библиотека с открытым исходным кодом Google, которая делает обучение и разработку моделей машинного обучения относительно безболезненными, Colab - это платформа, которая позволяет делать все это в браузере, а Project Magenta от Google использует машинное обучение для создания музыки.

Project Magenta - это проект TensorFlow, и он дикий. В среду вечером был концерт, на старте YACHT которого выступили The Flaming Lips. Обе группы внедрили музыкальные инновации на основе машинного обучения. YACHT скармливали своей музыке и текстам (и тем, на которые они повлияли), чтобы обучить ИИ, а затем использовали его для создания оригинальных мелодий и текстов. Затем группа собрала из них связные песни. Эти песни настолько же странны, насколько и убедительны. С другой стороны, The Flaming Lips использовали машинное обучение в своем концерте для воспроизведения фруктов. Фрукты были подключены к компьютерам с моделями машинного обучения, которые интерпретировали прессование фруктов как особую ноту. Google может объяснить это лучше, чем я. Я сказал, что это было дико?

5. Технологии могут спасти мир… возможно

Технологии не нейтральны. Об этом часто говорят, и не зря. Люди не нейтральны, поэтому вещи, которые мы делаем, тоже не нейтральны. Это всегда было правдой, тесты на IQ, как известно, предвзято относятся к эмоциональному интеллекту и культурным различиям. Исследования в целом страдают от исследований, проведенных в основном на белых мужчинах. В последнее время технологические предубеждения становятся все более очевидными с появлением чат-ботов с ИИ, которые быстро становятся женоненавистниками и расистами, алгоритмов найма, дискриминирующих женщин, и многого другого.

Но это не может быть только ужасно. Преимущество ненейтральности технологий в том, что они могут приносить пользу. Простите за мой позитивный настрой, но мы можем использовать технологии, чтобы спасти мир. Поскольку наши технологии отражают наши предубеждения и приоритеты, нам нужно изменить нас, чтобы изменить их. Давайте будем предвзято относиться к доступности. Давайте сделаем приоритетом решение проблемы бездомности. Наша технология последует этому примеру.

Улучшение доступности, конфиденциальности и управления данными - это все шаги, которые помогут нам достичь этого. Давайте подумаем шире - как нам спасти настоящую Землю? Я посетил сеанс, который объяснял именно это: как мы можем использовать ИИ для борьбы с изменением климата?

Спикеры обсудили эксперименты, в которых они пытались сделать существующие объекты более эффективными и сделать возобновляемые источники энергии более желательными.

Google хотел повысить эффективность своих центров обработки данных, поэтому обучил модели машинного обучения с подробной информацией о том, где распределяется ежедневное потребление энергии. Затем было проведено тестирование: сможет ли эта модель найти способ запустить систему, чтобы обеспечить тот же уровень производительности, но с меньшим потреблением энергии? Они обнаружили, что рекомендации ИИ человеку-оператору снизили потребление энергии в центре обработки данных на 40%. Это огромно.

Google хотел сделать свои ветряные фермы более прибыльными, сделав их производство энергии более надежным. Они использовали DeepMind и применили алгоритмы машинного обучения к 700 мегаватт ветряных электростанций Google. Они использовали прогнозы погоды и местные наблюдения за погодой в качестве исходных данных и сделали предварительные прогнозы для производства энергии ветра на 36 часов. Это привело к увеличению экономической стоимости энергии ветра, производимой фермами Google, на 20%.

Я здесь не для того, чтобы рекламировать Google. Я пытаюсь подчеркнуть, что потребление энергии центрами обработки данных огромно, а непредсказуемость энергии ветра является одной из основных причин, по которой она не получила широкого распространения. ИИ может внести поддающиеся количественной оценке изменения в решении этих проблем.

Технологии не нейтральны, но мы выбираем их сторону.