
1. Выявление моделей диабета среди индийцев с помощью машинного обучения
- Данные показывают, что в развивающихся странах будет наблюдаться увеличение числа больных диабетом на 266%.
- Оценка обучающей модели была великолепной 100%, что означает, что она правильно классифицировала все элементы, как видно из матрицы путаницы.
- Видно, что набор данных для обучения и тестирования был сбалансирован.
- При анализе матрицы путаницы для тестового набора данных было замечено, что очень немногие элементы были неправильно классифицированы по сравнению с моделью дерева решений.
- Модели машинного обучения, если они должным образом синхронизированы со знаниями анатомии и физиологии, клиническими параметрами, лабораторными параметрами и лекарствами, могут изменить правила игры в продолжающейся борьбе с диабетом.
Категории: диабет, машинное обучение
Уровень: начальный
Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2021/06/juicing-out-the-diabetes-patterns-amongst-indians-using-machine-learning/
2. Исследовательский анализ с использованием SPSS, Power BI, R Studio, Excel и Orange
Пример: проведите исследовательский анализ данных и создайте убедительную историю на основе предоставленного набора данных; также спрогнозируйте, какая статья будет более популярна в ближайшем будущем.
Веб-сайт: www.mashable.com
- В визуализациях (публикация по дням и популярность по дням) можно заметить, что Mashable обычно публикует меньше статей по выходным, так как люди не любят читать больше статей по выходным, причина может быть любой — Может быть, люди будут получают только субботу и воскресенье в качестве выходных, и они могут захотеть отдохнуть или путешествовать, а не читать статьи.
- Теперь популярность сравнивалась с различными темами (анализ основан на данных за последние два года): из визуализаций видно, что бизнес-статьи были менее популярны на веб-сайте Mashable.
- Из визуализаций видно, что статьи о стиле жизни были более популярны на веб-сайте Mashable.
- Из визуализаций также видно, что статьи в социальных сетях были более популярны на веб-сайте Mashable.
Категории: исследование данных
Уровень: начальный
Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2020/12/exploratory-analysis-using-spss-power-bi-r-studio-excel-orange/
3. Руководство для начинающих по коэффициенту корреляции Пирсона
- Корреляцию между непрерывными переменными можно найти с помощью python: на приведенной выше диаграмме рассеяния видно, что по мере увеличения длины автомобиля, снаряженного веса и ширины автомобиля цена автомобиля также увеличивается.
- Можно сказать, что существует положительная корреляция между тремя вышеуказанными переменными и ценой автомобиля. Значение «r» близко к +1 или -1, что означает, что все точки данных включены в линию наилучшего соответствия или рядом с ней соответственно.
- Вам необходимо учитывать выбросы, которые являются необычными только для одной переменной, называемой «одномерной переменной», или для обеих переменных, известных как «многомерные выбросы».
- Если мы построим график зависимости возраста от суммы, то мы, безусловно, увидим, что существует корреляция между возрастом человека и суммой кредита, выдаваемой этому человеку, по мере увеличения возраста сумма кредита, выдаваемого человеку, уменьшается, и наоборот.
Категории: коэффициент корреляции Пирсона.
Уровень: начинающий
Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2021/01/beginners-guide-to-pearsons-correlation-coefficient/
4. Прогнозирование цен на акции с использованием методов машинного обучения и глубокого обучения (с кодами Python)
- Вместо простого среднего мы будем использовать метод скользящего среднего, который использует последний набор значений для каждого прогноза.
- В значении RMSE нет большой разницы, но график для прогнозируемых и фактических значений должен обеспечить более четкое понимание.
- Хотя прогнозы с использованием этого метода намного лучше, чем у ранее реализованных моделей машинного обучения, эти прогнозы все еще не близки к реальным значениям.
- Существует ряд методов временных рядов, которые могут быть реализованы в наборе данных прогнозирования запасов, но большинство из этих методов требуют предварительной обработки большого количества данных перед подбором модели. LSTM является одним из них.
- В этой статье LSTM реализуется как черный ящик и проверяется его производительность на конкретных данных.
Категории: Auto Arima, KNN, линейная регрессия, LSTM, скользящая средняя, Facebook Prophet, Python, анализ фондового рынка, прогнозирование акций, временные ряды, прогнозирование временных рядов
Уровень: средний
Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2018/10/predicting-stock-price-machine-learningnd-deep-learning-techniques-python/
5. Использование возможностей глубокого обучения для кибербезопасности (часть 1)
- Глубокое обучение — это не серебряная пуля, которая может решить все проблемы информационной безопасности, поскольку для этого требуются обширные размеченные наборы данных.
- Автоматическое дифференцирование используется для расчета градиента, необходимого для расчета весов, которые будут использоваться в сети. в документе «Вывод информации о типе приложения из зашифрованного трафика Tor» были извлечены пакетные объемы и направления для создания модели HMM для обнаружения приложений TOR, которые могут генерировать этот трафик.
- Однако архитектура использует множество другой метаинформации, которую можно получить для классификации трафика. Например, если нужно обучить классификатор для обнаружения приложения, используемого TOR, то переобучить нужно только выходной слой, а все остальные уровни можно оставить прежними.
Категории: кибербезопасность, глубокое обучение, безопасность глубокого обучения, информационная безопасность.
Уровень: продвинутый
Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2018/07/using-power-deep-learning-cyber-security/
6. Алгоритм компьютерного зрения DeepMind привносит силу воображения для создания 3D-сцен из 2D-изображений.
- Без должным образом размеченных данных модель могла бы просто не существовать! Часто для обучения сложных моделей нам приходится вручную помечать и аннотировать изображения, которые будут использоваться алгоритмом.
- Другими словами, алгоритм ИИ может использовать 2D-изображения, чтобы понять или «представить», как объект выглядит под разными углами (которые не видны на изображении).
- GQN имеет возможность независимо узнавать о форме, размере и цвете объекта, а затем может комбинировать все эти функции для формирования точной 3D-модели.
- Кроме того, исследователи смогли использовать этот алгоритм для разработки новых сцен без необходимости явно обучать систему тому, какой объект должен быть куда.
- GQN не ограничивается маркировкой и аннотированием изображений, он может также использоваться автономными роботами для лучшего понимания своего окружения.
Категории:искусственный интеллект, компьютерное зрение, Deepmind, Google, DeepMind, обнаружение объектов
Уровень: продвинутый
Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2018/06/google-ai-create-3d-objects-using-2d-snapshots/
7. Часть 15: Пошаговое руководство по овладению НЛП — Тематическое моделирование с использованием NMF
- В этом методе учитывается каждое отдельное слово в матрице терминов документа. Но тот, у которого наибольший вес, считается темой для набора слов.
- Для измерения расстояния у нас есть несколько методов, но здесь, в этом сообщении блога, мы обсудим следующие два популярных метода, используемых практиками машинного обучения.
- Давайте подробно обсудим каждый из них один за другим, нажав на ссылку ниже.
Категории: Тематическое моделирование с использованием NMF
Уровень:продвинутый
Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2021/06/part-15-step-by-step-guide-to-master-nlp-topic- моделирование-использование-nmf/
Заключение
Я надеюсь, что вы нашли этот пост в блоге проницательным. Пожалуйста, поделитесь им со своими друзьями и семьей и подпишитесь на мой блог Keeping Up With Data Science, чтобы получать более информативный контент о науке о данных прямо в свой почтовый ящик. Вы можете связаться со мной в Twitter и LinkedIn. Я довольно активен там, и я буду рад поговорить с вами. Пожалуйста, не стесняйтесь оставлять свои отзывы в комментариях, которые помогают мне улучшить качество моей работы. Я буду продолжать делиться большим количеством контента по мере того, как буду расти и становиться специалистом по данным. До следующего раза, продолжайте суетиться и идти в ногу с наукой о данных. Удачного обучения 🙂