30-дневный письменный вызов

Я пренебрегла этим блогом; С ноября ничего не писала.

Я не буду извиняться. Я пишу для себя больше, чем для тебя, дорогой читатель. Письмо помогает мне организовать свои мысли и систематизировать свои убеждения. Я упустил возможность. Последние 6 месяцев я учился обрабатывать большие наборы данных (~ 100 миллионов записей) и строить конвейеры распределенной обработки. Я мог бы записывать все, что узнал, но я этого не делал.

Я собираюсь это изменить сегодня. Сегодня 1 апреля 2017 года, и я принимаю участие в 30 Day Writing Challenge. Я не буду публиковать каждый день, но буду писать каждый день.

Этот вызов совпал с началом новой работы. Я не буду говорить о деталях, пока не определюсь, но скажу, что создаю команду машинного обучения для стартапа, базирующегося в Бирмингеме, Великобритания.

У меня очень мало опыта в машинном обучении, поэтому и мой новый работодатель, и я делаем прыжок веры в то, что я смогу это понять. Мы хорошо ладили на собеседовании, и оба чувствовали, что можем эффективно работать вместе. Я полностью самоучка и всегда умел решать проблемы, поэтому начать работу без необходимых навыков не страшно. Однако я буду учиться намного быстрее, чем учился в школе, и я хочу вести записи об этом.

Примерно через 2 недели это будет мой первый день на новой работе. А пока я буду думать о том, как я хочу работать с данными, которые у меня будут. Я собираюсь исследовать различные алгоритмы и техники, а также подумать о деловой стороне создания новой команды.

Я не настолько наивен, чтобы думать, что могу написать план прямо сейчас, которого я буду придерживаться в следующие несколько месяцев - это совершенно нереально, поскольку все изменится. Я хочу быть готовым. Я хочу быть в правильном настроении, чтобы принять этот вызов. Я хочу обдумать различные возможности, чтобы, по крайней мере, знать, как подходить к проблемам, с которыми я столкнусь.

Суть моей работы - попытаться понять значение большого количества текста. В следующих нескольких публикациях я рассмотрю некоторые алгоритмы, которые я мог бы использовать. Затем я потрачу некоторое время на размышления о том, как я буду оценивать успех в моей новой роли. Как только я приступлю к новой работе, я буду записывать свой прогресс и возникающие проблемы.

Помимо записи, я хочу создать ресурс для других инженеров, которые хотят заняться машинным обучением. Многие статьи, которые я прочитал, написаны людьми с докторской степенью, и в их именах написано много букв. Они используют незнакомый язык и говорят о таких математических вещах, как байесовская классификация. Оказывается, всему этому есть разумное объяснение - байесовский классификатор просто дает вероятность того, что элемент принадлежит к определенной группе. Я хочу пролить свет на методы, которые мы можем использовать для добычи данных, используя простой язык и как можно меньше математики.

Пойдемте со мной в течение следующих 30 дней, чтобы понять, как мы можем найти смысл в больших наборах данных, как мы можем создавать успешные команды с нуля и как мы можем применить теорию на практике.

День 1: Приключения в машинном обучении
День 2: Человек разводит огонь - как находить важные слова в тексте
День 3: Пометка документов на основе важных слов
День 4 : Опасность взглянуть на проблемы через одну линзу
День 5: Поиск клиентов дойной коровы в ваших данных
День 6: Тянуть в одном направлении
День 7: Моя гора машинного обучения - достижение базового лагеря
День 8: выходной
День 9: выходной
День 10: Простейшее введение в нейронные сети
День 11: Один простой прием, чтобы исправить проблемы с почерком
День 12: Один странный прием, чтобы увидеть картину в целом

Это сообщение из моего 30-дневного письменного задания. Я инженер-программист, пытаюсь понять машинное обучение. У меня нет докторской степени, поэтому я буду объяснять вещи простым языком и множеством примеров.

Подпишитесь на меня в Twitter, чтобы увидеть мои последние сообщения. Если вам понравилась эта статья, нажмите кнопку в виде сердечка ниже, чтобы поделиться - это поможет другим людям увидеть ее.