Как я начал изучать науку о данных, не имея опыта работы с компьютерными науками

Парулет назад присоединился к нескольким онлайн-группам по анализу данных, чтобы получить помощь. В то время я понятия не имел о науке о данных. Я просто знал, что мне нравится статистика, математика, и меня интересовала наука о данных. Когда я начал изучать науку о данных, я тысячу раз, если не миллион раз, задавал себе и другим вопрос: «Должен ли я изучать язык программирования Python или R?».

Поверьте мне, очень легко переключиться с Python на R или с R на Python. В конце концов, они оба понадобятся вам для работы с разными проектами в области науки о данных. Каждый из этих языков имеет свои преимущества. Так что никогда не тратьте время зря, задавая такой вопрос. Просто выберите один язык и станьте мастером этого языка.

Как только я научился программировать на Python, я понял, что переключать языки легко. Понял, что программирование — это искусство, а не наука. для изучения языка программирования не нужно знать сложную математику, все дело в искусстве логики. Теперь я чувствую, что изучил настоящую магию, потому что могу сформулировать все, что приходит мне в голову. Это не только ощущается огромной силой, но и мощно.

Позвольте мне рассказать вам короткую правду о том, как мы думаем о науке о данных. Когда мы говорим об этом, мы, как правило, спрашиваем: «Мои данные X ГБ, насколько велик ваш набор данных?», «Вы можете кодировать?», «Какой язык программирования лучше всего подходит для науки о данных?» и т. д. Это не настоящая идея науки о данных. Наука о данных — это процесс формулирования количественного вопроса, на который можно ответить с помощью данных. Этот процесс включает в себя идентификацию данных, которые нам нужны для ответа на вопрос, их очистку, приведение в порядок, а затем анализ данных, будь то с помощью машинного обучения, статистики, нейронных сетей или чего-то еще.

Я студент экономического факультета, пару лет назад начал изучать науку о данных. После окончания бакалавриата я искал подходящую для меня карьеру и работал стажером в нескольких компаниях, изучая различные отрасли. В глубине души я искал работу, в которой мог бы использовать навыки, полученные на академических курсах Эконометрика и Теория игр.

Я обнаружил, что наука о данных является моим предпочтительным карьерным путем, когда я работал в фирме по разработке программного обеспечения в качестве стажера по исследованиям и операциям. Я работал там с командой маркетинга и данных. Мой начальник помог мне выбрать язык программирования, чтобы освоить его. Мне так понравилось там работать. Моя работа была интересной и сложной.

В какой-то момент мне пришлось уйти из-за нехватки времени. Я хотел больше сосредоточиться на изучении науки о данных. Я поискал в Google и составил список курсов, которые мне нужно пройти, чтобы начать заниматься наукой о данных. Мой первый курс был Введение в Python на Datacamp. Этот курс не дал мне многого, но дал краткий обзор области науки о данных. Это бесплатный курс, очень полезный для тех, у кого нет знаний в области программирования.

Изучив основы языка программирования, я выбрал Coursera в качестве своего колледжа по науке о данных. Я записался на «Специализация Python для всех», предлагаемую Мичиганским университетом на Coursera, и сделал специализацию. Я прошел несколько курсов по математике и аналитике, чтобы начать заниматься наукой о данных. Научился использовать базу данных с помощью SQL. Мне еще многому предстоит научиться.

Навыки, необходимые для того, чтобы стать специалистом по обработке и анализу данных: программирование, статистика, машинное обучение, линейная алгебра и исчисление, визуализация данных, общение, обработка данных, разработка программного обеспечения, интуитивное понимание данных

Имейте в виду, что вышеупомянутые навыки бесполезны, если вы не можете ответить на конкретные вопросы, используя данные. Ключевое слово в науке о данных — это не данные. Это наука — отвечать на вопросы, используя данные. Все дело в преобразовании данных в функциональную форму, а затем в выводе этих функций. с решениями. Не беспокойтесь о сложных вещах, о которых я только что сказал, компьютер вас спасет. Вам просто нужно понимать, что вы делаете.