Публикации по теме 'computer-vision'
Рассеяны о диффузионных моделях?
Расширение возможностей моделей генерации изображений на основе диффузии
Я был новичком в распространении три недели назад, но, учитывая шумиху, я хотел запрыгнуть в поезд распространения (что, я чувствую, мне удалось). Скорость, с которой происходят новые разработки в области генерации изображений на основе диффузии (DbIG), ошеломляет. Становится трудно понять, с чего начать путешествие. В этом посте я делюсь своим путешествием, которое может быть полезно другим, кто хочет создать..
Обзор проекта: использование компьютерного зрения и НЛП для подписи к рентгеновским снимкам
Обзор проекта: использование компьютерного зрения и НЛП для подписи к рентгеновским снимкам
Очистка данных, глубокое обучение и развертывание моделей для замены рентгенологов.
Автоматизация была основной движущей силой повышения эффективности, надежности и скорости во многих отраслях, от банковского дела до транспорта и сельского хозяйства. В этом проекте мы исследуем потенциал моделей глубокого обучения для автоматизации процесса составления отчетов о медицинских изображениях, в..
Модуль отслеживания позы с OpenCv и Mediapipe
Отслеживание позы — это задача обнаружения и отслеживания суставов человеческого тела на видео или изображении. В последние годы отслеживание поз становится все более популярным из-за его потенциального применения в различных областях, таких как игры, спорт, здравоохранение и робототехника. Это сложная задача из-за сложной природы движений человеческого тела и вариаций различных форм тела.
Этот проект посвящен созданию приложения для отслеживания поз с использованием библиотеки..
Машинное обучение и аутизм
Машинное обучение и аутизм
Краткий обзор литературы о том, как машинное обучение способствует диагностике и лечению аутизма.
Машинное обучение (ML) распространилось на многие области и дисциплины. Погрузиться в новую область — лучший способ расти и узнавать новое. Ниже приводится краткое изложение того, как исследователи применяли машинное обучение для диагностики и лечения расстройств аутистического спектра (РАС).
Документы (По порядку)
Все эти документы доступны без..
Распознавание написанных цифр с помощью машинного обучения
Если у вас есть хоть какой-то опыт программирования, то вы должны быть знакомы с тем, что «Hello World» — это первое, чему вас научили делать. В современном мире технологий машинное обучение берет верх и имеет гораздо больший потенциал, но для начала давайте представим «Hello World» искусственного интеллекта!
Одна из фундаментальных проблем искусственного интеллекта — научить нейронную сеть видеть мир и его содержимое так, как это делаем вы или я. Это называется компьютерное зрение...
Билинейные модели CNN для детального визуального распознавания
Билинейная CNN представлена на ICCV 2015, она немного устарела, но в ней есть несколько интересных концепций, которые я еще раз рассмотрю в этой статье. Ресурсы, использованные при подготовке этой статьи, перечислены в конце. Рассматриваются следующие концепции: FVGR, беспорядочные дескрипторы и формулировка билинейной модели.
Детальное визуальное распознавание (FVGR)
FVGR - это задача классификации, в которой визуальные различия внутри категорий невелики и могут подавляться такими..
Уменьшение масштаба изображений в HAM10000
В нашей предыдущей статье Проблемы размера с HAM10000 мы обсуждали, что у HAM10000 много данных. Каждое изображение имеет высоту 450 пикселей и ширину 600 пикселей, с тремя цветовыми каналами, всего 810 тыс. номеров. Если мы посмотрим на весь набор данных из 10 015 изображений, это примерно 8,1 миллиарда чисел. Это может быть очень неуступчивым, что приводит к проблемам с памятью и увеличению времени выполнения.
Одна из обсуждаемых нами стратегий заключалась в уменьшении..