Публикации по теме 'data-engineering'


Настоящий единорог: данные для тестирования машинного обучения
Давайте будем честными здесь; вы были на той встрече, где все кивали головами в знак согласия с тем, что хороший, упорядоченный рабочий процесс разработки → постановка → производственный процесс будет своевременно обнаруживать проблемы, черт возьми, это даже звучит как функциональное программирование! Но затем неизбежно последующее совещание о том, как # $ & #! ( нулевой указатель мог остановить производство, когда та самая сборка прошла тесты. По моему опыту, это почти всегда..

Представляем новый высокопроизводительный SDK для JavaScript от RudderStack
Большинство компаний тратят много времени и денег на разработку своих веб-сайтов, и для этого есть веская причина. Веб-сайты — это то, как современные потребители и покупатели взаимодействуют и строят отношения с бизнесом. В результате команды инженеров испытывают сильное давление, чтобы их веб-сайты всегда работали наилучшим образом. Чтобы помочь со скоростью страницы и общей производительностью страницы, мы рады представить последнюю версию нашего RudderStack JavaScript SDK. Новый..

Что такое Docker и почему это важно?
Docker — это платформа, которая доставляет программное обеспечение в пакетах. Это относится к платформе, предназначенной для разработки, доставки и запуска приложений в облегченных, переносимых и изолированных средах, называемых контейнерами. Контейнеры — это автономные единицы, которые инкапсулируют код приложения, среду выполнения, библиотеки и зависимости, обеспечивая согласованное и надежное выполнение в различных средах. Если вы какое-то время участвовали в разработке..

Тема: 4-х функциональный трансформатор
В Feature Engineering преобразователь — это функция или набор функций, которые применяются к набору данных для извлечения или создания новых функций из исходных данных. Это можно использовать для повышения производительности модели машинного обучения, предоставляя ей более информативные или релевантные входные функции. Вот некоторые примеры преобразователей признаков: 𝐍𝐨𝐫𝐦𝐚𝐥𝐢𝐳𝐚𝐭𝐢𝐨𝐧: Преобразование объекта, чтобы иметь среднее значение 0 и стандартное отклонение 1. 𝐎𝐧𝐞-𝐡𝐨𝐭..

1) Пагинация API с Python
Лучшие практики работы с API в реальном мире Делать запросы к API в Python очень просто. Сделать это надежным, чистым и масштабируемым способом — совсем другая история. вступление Python прославился за последние 5–10 лет и в настоящее время является одним из самых популярных языков программирования в мире. Его легко освоить из-за его высокоуровневого (в стиле псевдокода) синтаксиса, и это позволяет легко начать писать действительно полезные скрипты. Для новичка это..

Apache Spark для науки о данных — Как установить и начать работу с PySpark
Установите PySpark локально и загрузите свой первый набор данных — требуется всего 5 минут В мире больших данных необходимо знать, как эффективно обрабатывать огромные наборы данных. Вот тут-то и появляется Apache Spark. Это платформа обработки данных, используемая для выполнения задач обработки данных в огромных наборах данных. Spark также позволяет распределять задачи обработки данных между несколькими компьютерами. Spark написан на Scala, но вам не нужно знать Scala, чтобы..

Изучение магии объятий лица: ваш путь к подключению к искусственному интеллекту
Авторы Шивам Мустерья и Шрути Джайн (руководители редакции DJS S4DS ) Находясь на переднем крае слияния технологий и языков, Hugging Face становится первопроходцем в области обработки естественного языка (НЛП). Эта инновационная компания и сообщество открытого исходного кода меняют ландшафт НЛП, разрушают языковые барьеры и способствуют беспрепятственному общению между людьми и машинами. Присоединяйтесь к нам, и мы углубимся в преобразующую силу Hugging Face, узнаем, как она..