Статьи по теме data-science

Публикации по теме 'data-science'

Объяснение индекса Pandas

Панды - лучший друг Data Scientist, а индекс - невидимая душа, стоящая за пандами. Мы тратим много времени на такие методы, как loc, iloc, filtering, stack / unstack, concat, merge, pivot и многие другие, обрабатывая и анализируя наши данные, особенно когда мы работаем над новой проблемой. И эти методы используют индексы, даже большинство ошибок , с которыми мы сталкиваемся, являются ошибками индексов. Индекс стал более важным в данных временных рядов . Визуализация также..

4 нетехнических шага, которые помогут вам стать отличным аналитиком

Дело не в том, что вы делаете, а в том, как вы это делаете Когда дело доходит до карьерного роста аналитика данных, нетехнические или «мягкие» навыки могут оказаться довольно низкими в вашем списке приоритетов. В конце концов, думая о должности аналитика, в первую очередь приходят на ум технические навыки. Вероятно, вы просто пытаетесь получить опыт, используя свои технические навыки, чтобы отвечать на вопросы бизнеса или создавать продукты. На самом деле вы не пытаетесь сделать ничего..

Преобразование данных в чистом Python

Никаких внешних библиотек не требуется Разработчики часто выбирают Python для написания преобразований данных. Благодаря обширной экосистеме сторонних пакетов функциональность может быть быстро интегрирована. При работе с большими данными библиотеки типа pandas , PySpark , NumPy , TensorFlow и PyTorch позволяют быстро манипулировать и преобразовывать данные. Но что, если у вас есть небольшие данные, пара сотен записей или даже тысяча. Вам нужно использовать внешние..

Организация творческих итераций процесса машинного обучения

Работа над любой проблемой машинного обучения - это процесс творческой итерации . Помимо разработки программного обеспечения, он включает в себя, среди прочего, исследования, эксперименты и анализ результатов. Написанный в псевдокоде, он будет выглядеть примерно так: Вы строите свою модель, рассчитываете метрики на основе данных проверки, погружаетесь в результаты, чтобы определить, где ваша модель не работает, и повторно исследуете идеи, как ее улучшить. Как только эти идеи..

Объем последовательности: есть ли приятель на рынке магазина функций?

Еженедельный информационный бюллетень, в котором обсуждаются важные исследовательские работы по машинному обучению, интересные технические выпуски, деньги, полученные от ИИ, и реальные реализации. Sequence Scope - это сводка наиболее важных опубликованных исследовательских работ, опубликованных новостей о технологиях и стартапах в экосистеме ИИ за последнюю неделю. Этот сборник является частью информационного бюллетеня TheSequence. Специалисты по анализу данных, ученые и разработчики..

Автоматизируйте структуру ваших проектов по науке о данных с помощью Cookiecutter

Прекратите ручную работу, вместо этого повторно используйте шаблоны проектов Вот ситуация, с которой знакомы многие специалисты по данным. Каждый раз, когда вы начинаете новый проект, вы повторно используете структуру старых проектов. Вы просматриваете их папки и копируете-вставляете их, вы удаляете ненужные файлы, вы переименовываете оставшиеся в соответствии с особенностями вашего нового проекта, заходите внутрь каждого файла конфигурации и заменяете старые переменные среды..

Моя платформа для помощи стартапам в создании и развертывании науки о данных

Как максимально быстро перейти от идеи к MVP Я помогаю стартапам перейти от «продукта» к «продукту + машинное обучение». Это моя схема достижения этого, включая советы, предостережения и примеры на каждом этапе. Хотя каждая компания, проблема и данные разные, всегда есть много общего. Эта структура вращается вокруг создания доказательства концепции как можно скорее, а затем постепенного ее улучшения. Это следует из моего опыта в ML: вы не знаете, будет ли что-то работать, пока..