Публикации по теме 'scikit-learn'


10 лучших библиотек Python с примером кода
Существует бесчисленное множество библиотек Python, но вот 10 популярных вместе с примерами кода для каждой. Эти примеры демонстрируют базовое использование, а более подробную документацию и учебные пособия можно найти в Интернете. NumPy (числовой Python) import numpy as np a = np.array([1, 2, 3]) b = np.array([4, 5, 6]) c = a + b print(c) Панды (обработка данных) import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6]} df = pd.DataFrame(data) print(df)..

Основы распознавания изображений с использованием реализации Python Scikit-Learn
Как и в связи с растущей известностью машинного обучения и аналитики больших данных, одной из наиболее исследуемых областей анализа неструктурированных данных является обработка и распознавание изображений. Если мы посмотрим в Интернете, у нас есть система безопасности, которая пытается улучшить распознавание изображений, наши смартфоны улучшают захват изображений с помощью распознавания лиц и использования Google TensorFlow для всех видов классификации изображений. Если вы следили..

Увеличение точности расчетного времени прибытия вдвое с помощью машинного обучения в производстве
Это первая публикация из нашей серии о машинном обучении Авторы Тайво Кяспер , Антон Потапчук и Максим Мишин Если попросить описать Sixfold одним предложением, разумным ответом будет: «Мы оцениваем время прибытия миллионов грузовых грузовых автомобилей». Расчетное время прибытия (ETA) - это основа нашей деятельности. Мы ежедневно вычисляем миллионы прогнозов ETA и делаем это без серьезных инцидентов в течение почти четырех лет. Первоначально мы в основном полагались на..

Практическое машинное обучение — Простой линейный регресс
Возможно, одной из лучших книг по python и науке о данных является Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow Герона. На мой взгляд, эта книга особенно хороша для начинающих. Для специалистов-самоучек эта книга просто необходима. Есть несколько управляемых проектов с включенным кодом, который поможет начинающим специалистам по данным на этом пути. Знание Scikit-Learn, Keras и TensorFlow также является обязательным для специалистов по данным, поскольку..

Гибридное машинное обучение на основе правил с помощью scikit-learn
Используйте знания предметной области, чтобы дополнить свои модели scikit-learn с помощью жестко запрограммированных правил TL; DR scikit-learn не позволяет добавлять жестко запрограммированные правила в вашу модель машинного обучения, но для многих случаев использования вы должны! В этой статье рассказывается, как можно использовать знания предметной области и объектно-ориентированное программирование (ООП) для создания гибридных моделей машинного обучения на основе правил поверх..

Активное обучение: обучение с ограниченными помеченными данными в Python (Scikit-learn, Active Learning Lib)
Активное обучение — это подход к машинному обучению, который позволяет выбирать наиболее информативные точки данных для пометки оракулом, тем самым уменьшая количество помеченных точек данных, необходимых для обучения модели. Активное обучение полезно в сценариях, где получение размеченных данных ограничено или требует больших затрат. Активное обучение может помочь повысить точность моделей машинного обучения с меньшим количеством помеченных точек данных. Обучение с ограниченными..

Введение в векторизацию счета NLP и TF-IDF (часть 2)
Давайте вместе изучим TF-IDF. После введения векторизации подсчета слов в Часть 1 . Давайте быстро и глубоко погрузимся в TF-IDF. Предположим, что большой корпус документов содержит токены, которые очень часто встречаются в документах, но не несут особого смысла; такие токены, как «находится», «на», «до» и т. д. Алгоритмы машинного обучения могут интерпретировать их как важные характеристики из-за их относительно более высоких значений в матрице и могут иметь меньший вес по..