Kaggle - одна из лучших платформ для энтузиастов науки о данных. Он стал одинаково любимым местом как для новичков, так и для профессионалов, где они могут поделиться своими решениями с наборами данных. Я пишу код на Kaggle уже почти 3 года, начиная с бакалавриата и до настоящего времени. В этой статье я поделюсь своим опытом и уроками, полученными за 3 года работы в Kaggling.

Начните с малого, достигните максимума

Kaggle - большое место, вы найдете там всевозможные проблемы, и новичок в этом веб-сайте и в области науки о данных часто ошеломляет. Здесь нужно иметь в виду, что нужно начинать с основ, а затем строить оттуда. Это позволит лучше учиться и избежать больших шагов без знаний.

Соревнования - это нормально, если вы станете экспертом

Соревнования Kaggle имеют привлекательную цену, и победа в них станет большим хитом для вашего профиля. Но не расстраивайтесь, если это не так - вы новичок и все еще учитесь. Если вы чувствуете, что соревнования слишком обширны, чтобы вы даже пытались их предпринять, лучше всего было бы начать вносить решения в наборы данных, на которые, как вы думаете, вы способны, а затем наращивать их. Помните, Kaggle - это общественное место. Здесь вы найдете самых разных людей - профессионалов отрасли, исследователей, ученых, а также новичков. Так что не расстраивайтесь, если вы не подходите для соревнований, потому что другие намного опережают вас, ваше время скоро придет.

Kaggle - это не просто машинное обучение

Kaggle - отличное место для энтузиастов науки о данных, но речь идет не только о модном машинном обучении. Существует множество наборов данных для исследовательского анализа данных и проектирования функций. Практикуйте их тоже. Проанализируйте их и сделайте несколько интересных выводов. Выполните некоторую разработку функций и посмотрите, насколько глубоко вы можете получить. Это также хранилище реальных наборов данных, которые гораздо интереснее анализировать.

Дело не только в наборах данных

Вы также можете общаться и встречаться с людьми на Kaggle. Это отличное место для общения и обмена идеями и знаниями. Используйте его с максимальной пользой - это поможет вам в вашем путешествии по науке о данных. Сетевое взаимодействие - отличная задача, особенно если вы новичок или хотите изучить Data Science. Совет и помощь отраслевых экспертов или ваших коллег могут дать вам отличный опыт обучения.

Сделайте, прежде чем взглянуть

Тенденция заглядывать в чужую работу, когда вы работаете над проблемой, - обычное дело, но старайтесь не делать этого, потому что, если решение известно, зачем нужны специалисты в области науки о данных или аналитика? Попробуйте сначала решить самостоятельно (полное или частичное), а затем взгляните на записные книжки с наибольшим количеством голосов или популярности. Это даст вам лучшее представление о решении проблем по мере того, как вы продолжите учиться по лучшим тетрадям и подниметесь по лестнице своего обучения.

Прекратить сравнение

Самая большая ошибка новичков - это сравнивать с другими кагглерами, что приводит к так называемому «синдрому самозванца». Вместо того чтобы сравнивать, посмотрите, где вы отстаете, чему вы не научились, а затем работайте над этим. Помните, как я упоминал ранее, это публичная платформа, есть люди, которые намного опережают вас.

Спасибо за чтение!

Полезные ссылки: