Анализ моделей диабета среди индийцев, Руководство для начинающих по корреляции Пирсона…

1. Выявление моделей диабета среди индийцев с помощью машинного обучения

Данные показывают, что в развивающихся странах будет наблюдаться увеличение числа больных диабетом на 266%.
Оценка обучающей модели была великолепной 100%, что означает, что она правильно классифицировала все элементы, как видно из матрицы путаницы.
Видно, что набор данных для обучения и тестирования был сбалансирован.
При анализе матрицы путаницы для тестового набора данных было замечено, что очень немногие элементы были неправильно классифицированы по сравнению с моделью дерева решений.
Модели машинного обучения, если они должным образом синхронизированы со знаниями анатомии и физиологии, клиническими параметрами, лабораторными параметрами и лекарствами, могут изменить правила игры в продолжающейся борьбе с диабетом.

Категории: диабет, машинное обучение

Уровень: начальный

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2021/06/juicing-out-the-diabetes-patterns-amongst-indians-using-machine-learning/

2. Исследовательский анализ с использованием SPSS, Power BI, R Studio, Excel и Orange

Пример: проведите исследовательский анализ данных и создайте убедительную историю на основе предоставленного набора данных; также спрогнозируйте, какая статья будет более популярна в ближайшем будущем.

Веб-сайт: www.mashable.com

В визуализациях (публикация по дням и популярность по дням) можно заметить, что Mashable обычно публикует меньше статей по выходным, так как люди не любят читать больше статей по выходным, причина может быть любой — Может быть, люди будут получают только субботу и воскресенье в качестве выходных, и они могут захотеть отдохнуть или путешествовать, а не читать статьи.
Теперь популярность сравнивалась с различными темами (анализ основан на данных за последние два года): из визуализаций видно, что бизнес-статьи были менее популярны на веб-сайте Mashable.
Из визуализаций видно, что статьи о стиле жизни были более популярны на веб-сайте Mashable.
Из визуализаций также видно, что статьи в социальных сетях были более популярны на веб-сайте Mashable.

Категории: исследование данных

Уровень: начальный

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2020/12/exploratory-analysis-using-spss-power-bi-r-studio-excel-orange/

3. Руководство для начинающих по коэффициенту корреляции Пирсона

Корреляцию между непрерывными переменными можно найти с помощью python: на приведенной выше диаграмме рассеяния видно, что по мере увеличения длины автомобиля, снаряженного веса и ширины автомобиля цена автомобиля также увеличивается.
Можно сказать, что существует положительная корреляция между тремя вышеуказанными переменными и ценой автомобиля. Значение «r» близко к +1 или -1, что означает, что все точки данных включены в линию наилучшего соответствия или рядом с ней соответственно.
Вам необходимо учитывать выбросы, которые являются необычными только для одной переменной, называемой «одномерной переменной», или для обеих переменных, известных как «многомерные выбросы».
Если мы построим график зависимости возраста от суммы, то мы, безусловно, увидим, что существует корреляция между возрастом человека и суммой кредита, выдаваемой этому человеку, по мере увеличения возраста сумма кредита, выдаваемого человеку, уменьшается, и наоборот.

Категории: коэффициент корреляции Пирсона.

Уровень: начинающий

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2021/01/beginners-guide-to-pearsons-correlation-coefficient/

4. Прогнозирование цен на акции с использованием методов машинного обучения и глубокого обучения (с кодами Python)

Вместо простого среднего мы будем использовать метод скользящего среднего, который использует последний набор значений для каждого прогноза.
В значении RMSE нет большой разницы, но график для прогнозируемых и фактических значений должен обеспечить более четкое понимание.
Хотя прогнозы с использованием этого метода намного лучше, чем у ранее реализованных моделей машинного обучения, эти прогнозы все еще не близки к реальным значениям.
Существует ряд методов временных рядов, которые могут быть реализованы в наборе данных прогнозирования запасов, но большинство из этих методов требуют предварительной обработки большого количества данных перед подбором модели. LSTM является одним из них.
В этой статье LSTM реализуется как черный ящик и проверяется его производительность на конкретных данных.

Категории: Auto Arima, KNN, линейная регрессия, LSTM, скользящая средняя, Facebook Prophet, Python, анализ фондового рынка, прогнозирование акций, временные ряды, прогнозирование временных рядов

Уровень: средний

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2018/10/predicting-stock-price-machine-learningnd-deep-learning-techniques-python/

5. Использование возможностей глубокого обучения для кибербезопасности (часть 1)

Глубокое обучение — это не серебряная пуля, которая может решить все проблемы информационной безопасности, поскольку для этого требуются обширные размеченные наборы данных.
Автоматическое дифференцирование используется для расчета градиента, необходимого для расчета весов, которые будут использоваться в сети. в документе «Вывод информации о типе приложения из зашифрованного трафика Tor» были извлечены пакетные объемы и направления для создания модели HMM для обнаружения приложений TOR, которые могут генерировать этот трафик.
Однако архитектура использует множество другой метаинформации, которую можно получить для классификации трафика. Например, если нужно обучить классификатор для обнаружения приложения, используемого TOR, то переобучить нужно только выходной слой, а все остальные уровни можно оставить прежними.

Категории: кибербезопасность, глубокое обучение, безопасность глубокого обучения, информационная безопасность.

Уровень: продвинутый

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2018/07/using-power-deep-learning-cyber-security/

6. Алгоритм компьютерного зрения DeepMind привносит силу воображения для создания 3D-сцен из 2D-изображений.

Без должным образом размеченных данных модель могла бы просто не существовать! Часто для обучения сложных моделей нам приходится вручную помечать и аннотировать изображения, которые будут использоваться алгоритмом.
Другими словами, алгоритм ИИ может использовать 2D-изображения, чтобы понять или «представить», как объект выглядит под разными углами (которые не видны на изображении).
GQN имеет возможность независимо узнавать о форме, размере и цвете объекта, а затем может комбинировать все эти функции для формирования точной 3D-модели.
Кроме того, исследователи смогли использовать этот алгоритм для разработки новых сцен без необходимости явно обучать систему тому, какой объект должен быть куда.
GQN не ограничивается маркировкой и аннотированием изображений, он может также использоваться автономными роботами для лучшего понимания своего окружения.

Категории:искусственный интеллект, компьютерное зрение, Deepmind, Google, DeepMind, обнаружение объектов

Уровень: продвинутый

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2018/06/google-ai-create-3d-objects-using-2d-snapshots/

7. Часть 15: Пошаговое руководство по овладению НЛП — Тематическое моделирование с использованием NMF

В этом методе учитывается каждое отдельное слово в матрице терминов документа. Но тот, у которого наибольший вес, считается темой для набора слов.
Для измерения расстояния у нас есть несколько методов, но здесь, в этом сообщении блога, мы обсудим следующие два популярных метода, используемых практиками машинного обучения.
Давайте подробно обсудим каждый из них один за другим, нажав на ссылку ниже.

Категории: Тематическое моделирование с использованием NMF

Уровень:продвинутый

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2021/06/part-15-step-by-step-guide-to-master-nlp-topic- моделирование-использование-nmf/

Заключение

Я надеюсь, что вы нашли этот пост в блоге проницательным. Пожалуйста, поделитесь им со своими друзьями и семьей и подпишитесь на мой блог Keeping Up With Data Science, чтобы получать более информативный контент о науке о данных прямо в свой почтовый ящик. Вы можете связаться со мной в Twitter и LinkedIn. Я довольно активен там, и я буду рад поговорить с вами. Пожалуйста, не стесняйтесь оставлять свои отзывы в комментариях, которые помогают мне улучшить качество моей работы. Я буду продолжать делиться большим количеством контента по мере того, как буду расти и становиться специалистом по данным. До следующего раза, продолжайте суетиться и идти в ногу с наукой о данных. Удачного обучения 🙂

Предложения по подаче заявок на Mlearning.ai
Как стать писателем на Mlearning.aimedium.com