Публикации по теме 'computer-vision'


Рассеяны о диффузионных моделях?
Расширение возможностей моделей генерации изображений на основе диффузии Я был новичком в распространении три недели назад, но, учитывая шумиху, я хотел запрыгнуть в поезд распространения (что, я чувствую, мне удалось). Скорость, с которой происходят новые разработки в области генерации изображений на основе диффузии (DbIG), ошеломляет. Становится трудно понять, с чего начать путешествие. В этом посте я делюсь своим путешествием, которое может быть полезно другим, кто хочет создать..

Обзор проекта: использование компьютерного зрения и НЛП для подписи к рентгеновским снимкам
Обзор проекта: использование компьютерного зрения и НЛП для подписи к рентгеновским снимкам Очистка данных, глубокое обучение и развертывание моделей для замены рентгенологов. Автоматизация была основной движущей силой повышения эффективности, надежности и скорости во многих отраслях, от банковского дела до транспорта и сельского хозяйства. В этом проекте мы исследуем потенциал моделей глубокого обучения для автоматизации процесса составления отчетов о медицинских изображениях, в..

Модуль отслеживания позы с OpenCv и Mediapipe
Отслеживание позы — это задача обнаружения и отслеживания суставов человеческого тела на видео или изображении. В последние годы отслеживание поз становится все более популярным из-за его потенциального применения в различных областях, таких как игры, спорт, здравоохранение и робототехника. Это сложная задача из-за сложной природы движений человеческого тела и вариаций различных форм тела. Этот проект посвящен созданию приложения для отслеживания поз с использованием библиотеки..

Машинное обучение и аутизм
Машинное обучение и аутизм Краткий обзор литературы о том, как машинное обучение способствует диагностике и лечению аутизма. Машинное обучение (ML) распространилось на многие области и дисциплины. Погрузиться в новую область — лучший способ расти и узнавать новое. Ниже приводится краткое изложение того, как исследователи применяли машинное обучение для диагностики и лечения расстройств аутистического спектра (РАС). Документы (По порядку) Все эти документы доступны без..

Распознавание написанных цифр с помощью машинного обучения
Если у вас есть хоть какой-то опыт программирования, то вы должны быть знакомы с тем, что «Hello World» — это первое, чему вас научили делать. В современном мире технологий машинное обучение берет верх и имеет гораздо больший потенциал, но для начала давайте представим «Hello World» искусственного интеллекта! Одна из фундаментальных проблем искусственного интеллекта — научить нейронную сеть видеть мир и его содержимое так, как это делаем вы или я. Это называется компьютерное зрение...

Билинейные модели CNN для детального визуального распознавания
Билинейная CNN представлена ​​на ICCV 2015, она немного устарела, но в ней есть несколько интересных концепций, которые я еще раз рассмотрю в этой статье. Ресурсы, использованные при подготовке этой статьи, перечислены в конце. Рассматриваются следующие концепции: FVGR, беспорядочные дескрипторы и формулировка билинейной модели. Детальное визуальное распознавание (FVGR) FVGR - это задача классификации, в которой визуальные различия внутри категорий невелики и могут подавляться такими..

Уменьшение масштаба изображений в HAM10000
В нашей предыдущей статье Проблемы размера с HAM10000 мы обсуждали, что у HAM10000 много данных. Каждое изображение имеет высоту 450 пикселей и ширину 600 пикселей, с тремя цветовыми каналами, всего 810 тыс. номеров. Если мы посмотрим на весь набор данных из 10 015 изображений, это примерно 8,1 миллиарда чисел. Это может быть очень неуступчивым, что приводит к проблемам с памятью и увеличению времени выполнения. Одна из обсуждаемых нами стратегий заключалась в уменьшении..