1. Выявление моделей диабета среди индийцев с помощью машинного обучения

  • Данные показывают, что в развивающихся странах будет наблюдаться увеличение числа больных диабетом на 266%.
  • Оценка обучающей модели была великолепной 100%, что означает, что она правильно классифицировала все элементы, как видно из матрицы путаницы.
  • Видно, что набор данных для обучения и тестирования был сбалансирован.
  • При анализе матрицы путаницы для тестового набора данных было замечено, что очень немногие элементы были неправильно классифицированы по сравнению с моделью дерева решений.
  • Модели машинного обучения, если они должным образом синхронизированы со знаниями анатомии и физиологии, клиническими параметрами, лабораторными параметрами и лекарствами, могут изменить правила игры в продолжающейся борьбе с диабетом.

Категории: диабет, машинное обучение

Уровень: начальный

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2021/06/juicing-out-the-diabetes-patterns-amongst-indians-using-machine-learning/

2. Исследовательский анализ с использованием SPSS, Power BI, R Studio, Excel и Orange

Пример: проведите исследовательский анализ данных и создайте убедительную историю на основе предоставленного набора данных; также спрогнозируйте, какая статья будет более популярна в ближайшем будущем.

Веб-сайт: www.mashable.com

  • В визуализациях (публикация по дням и популярность по дням) можно заметить, что Mashable обычно публикует меньше статей по выходным, так как люди не любят читать больше статей по выходным, причина может быть любой — Может быть, люди будут получают только субботу и воскресенье в качестве выходных, и они могут захотеть отдохнуть или путешествовать, а не читать статьи.
  • Теперь популярность сравнивалась с различными темами (анализ основан на данных за последние два года): из визуализаций видно, что бизнес-статьи были менее популярны на веб-сайте Mashable.
  • Из визуализаций видно, что статьи о стиле жизни были более популярны на веб-сайте Mashable.
  • Из визуализаций также видно, что статьи в социальных сетях были более популярны на веб-сайте Mashable.

Категории: исследование данных

Уровень: начальный

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2020/12/exploratory-analysis-using-spss-power-bi-r-studio-excel-orange/

3. Руководство для начинающих по коэффициенту корреляции Пирсона

  • Корреляцию между непрерывными переменными можно найти с помощью python: на приведенной выше диаграмме рассеяния видно, что по мере увеличения длины автомобиля, снаряженного веса и ширины автомобиля цена автомобиля также увеличивается.
  • Можно сказать, что существует положительная корреляция между тремя вышеуказанными переменными и ценой автомобиля. Значение «r» близко к +1 или -1, что означает, что все точки данных включены в линию наилучшего соответствия или рядом с ней соответственно.
  • Вам необходимо учитывать выбросы, которые являются необычными только для одной переменной, называемой «одномерной переменной», или для обеих переменных, известных как «многомерные выбросы».
  • Если мы построим график зависимости возраста от суммы, то мы, безусловно, увидим, что существует корреляция между возрастом человека и суммой кредита, выдаваемой этому человеку, по мере увеличения возраста сумма кредита, выдаваемого человеку, уменьшается, и наоборот.

Категории: коэффициент корреляции Пирсона.

Уровень: начинающий

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2021/01/beginners-guide-to-pearsons-correlation-coefficient/

4. Прогнозирование цен на акции с использованием методов машинного обучения и глубокого обучения (с кодами Python)

  • Вместо простого среднего мы будем использовать метод скользящего среднего, который использует последний набор значений для каждого прогноза.
  • В значении RMSE нет большой разницы, но график для прогнозируемых и фактических значений должен обеспечить более четкое понимание.
  • Хотя прогнозы с использованием этого метода намного лучше, чем у ранее реализованных моделей машинного обучения, эти прогнозы все еще не близки к реальным значениям.
  • Существует ряд методов временных рядов, которые могут быть реализованы в наборе данных прогнозирования запасов, но большинство из этих методов требуют предварительной обработки большого количества данных перед подбором модели. LSTM является одним из них.
  • В этой статье LSTM реализуется как черный ящик и проверяется его производительность на конкретных данных.

Категории: Auto Arima, KNN, линейная регрессия, LSTM, скользящая средняя, ​​Facebook Prophet, Python, анализ фондового рынка, прогнозирование акций, временные ряды, прогнозирование временных рядов

Уровень: средний

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2018/10/predicting-stock-price-machine-learningnd-deep-learning-techniques-python/

5. Использование возможностей глубокого обучения для кибербезопасности (часть 1)

  • Глубокое обучение — это не серебряная пуля, которая может решить все проблемы информационной безопасности, поскольку для этого требуются обширные размеченные наборы данных.
  • Автоматическое дифференцирование используется для расчета градиента, необходимого для расчета весов, которые будут использоваться в сети. в документе «Вывод информации о типе приложения из зашифрованного трафика Tor» были извлечены пакетные объемы и направления для создания модели HMM для обнаружения приложений TOR, которые могут генерировать этот трафик.
  • Однако архитектура использует множество другой метаинформации, которую можно получить для классификации трафика. Например, если нужно обучить классификатор для обнаружения приложения, используемого TOR, то переобучить нужно только выходной слой, а все остальные уровни можно оставить прежними.

Категории: кибербезопасность, глубокое обучение, безопасность глубокого обучения, информационная безопасность.

Уровень: продвинутый

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2018/07/using-power-deep-learning-cyber-security/

6. Алгоритм компьютерного зрения DeepMind привносит силу воображения для создания 3D-сцен из 2D-изображений.

  • Без должным образом размеченных данных модель могла бы просто не существовать! Часто для обучения сложных моделей нам приходится вручную помечать и аннотировать изображения, которые будут использоваться алгоритмом.
  • Другими словами, алгоритм ИИ может использовать 2D-изображения, чтобы понять или «представить», как объект выглядит под разными углами (которые не видны на изображении).
  • GQN имеет возможность независимо узнавать о форме, размере и цвете объекта, а затем может комбинировать все эти функции для формирования точной 3D-модели.
  • Кроме того, исследователи смогли использовать этот алгоритм для разработки новых сцен без необходимости явно обучать систему тому, какой объект должен быть куда.
  • GQN не ограничивается маркировкой и аннотированием изображений, он может также использоваться автономными роботами для лучшего понимания своего окружения.

Категории:искусственный интеллект, компьютерное зрение, Deepmind, Google, DeepMind, обнаружение объектов

Уровень: продвинутый

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2018/06/google-ai-create-3d-objects-using-2d-snapshots/

7. Часть 15: Пошаговое руководство по овладению НЛП — Тематическое моделирование с использованием NMF

  • В этом методе учитывается каждое отдельное слово в матрице терминов документа. Но тот, у которого наибольший вес, считается темой для набора слов.
  • Для измерения расстояния у нас есть несколько методов, но здесь, в этом сообщении блога, мы обсудим следующие два популярных метода, используемых практиками машинного обучения.
  • Давайте подробно обсудим каждый из них один за другим, нажав на ссылку ниже.

Категории: Тематическое моделирование с использованием NMF

Уровень:продвинутый

Ссылка на всю статью: https://www.analyticsvidhya.com/blog/2021/06/part-15-step-by-step-guide-to-master-nlp-topic- моделирование-использование-nmf/

Заключение

Я надеюсь, что вы нашли этот пост в блоге проницательным. Пожалуйста, поделитесь им со своими друзьями и семьей и подпишитесь на мой блог Keeping Up With Data Science, чтобы получать более информативный контент о науке о данных прямо в свой почтовый ящик. Вы можете связаться со мной в Twitter и LinkedIn. Я довольно активен там, и я буду рад поговорить с вами. Пожалуйста, не стесняйтесь оставлять свои отзывы в комментариях, которые помогают мне улучшить качество моей работы. Я буду продолжать делиться большим количеством контента по мере того, как буду расти и становиться специалистом по данным. До следующего раза, продолжайте суетиться и идти в ногу с наукой о данных. Удачного обучения 🙂