Публикации по теме 'computer-vision'
Как использовать Caire, библиотеку изменения размера изображений с учетом содержимого
Несколько человек жаловались на отсутствие подробных инструкций по использованию моего приложения Go под названием Caire для изменения размера изображения с учетом содержимого. Если вы не слышали о проекте, вы можете ознакомиться с репозиторием здесь: https://github.com/esimov/caire . Подробный технический обзор самого приложения и его реализации есть на моем личном сайте по адресу https://esimov.com/2019/05/caire-a-content-aware-image-resizing-library , но правда в том, что он не..
Классификация продуктов питания
Часть 1 Нейронная сеть Pytorch с нуля
Компьютерное зрение (CNN)
Компьютерное зрение относится к области искусственного интеллекта и информатики, которая направлена на то, чтобы позволить компьютерам понимать и интерпретировать визуальные данные. Он включает в себя разработку алгоритмов и методов, которые позволяют компьютерам анализировать, обрабатывать и извлекать значимую информацию из изображений или видео. Конечная цель компьютерного зрения — позволить машинам воспринимать и..
Обнаружение рук и подсчет пальцев с использованием OpenCV-Python
Реализация обнаружения рук с использованием OpenCV-Python с теоремой косинуса для задачи подсчета пальцев.
Увидев изображение выше, вы очень взволнованы тем, что реализовали его (как и я). Так что, не теряя слишком много времени, перейдем к коду.
OpenCV
OpenCV (библиотека компьютерного зрения с открытым исходным кодом) - это библиотека программного обеспечения для компьютерного зрения и машинного обучения с открытым исходным кодом. OpenCV был создан для обеспечения общей..
Как использовать SAM —«Модель Segment Anything: пошаговое руководство по сегментации изображений и видео»
https://youtu.be/lvsC8N6QjPg
Хотите научиться сегментировать объекты, людей и сцены на изображениях и видео с помощью SAM? Посмотрите наше последнее видеоруководство: «Как использовать модель SAM — Segment Anything: пошаговое руководство по сегментации изображений и видео». Следите за процессом, от настройки Python до передовых методов.
#SAM #SegmentAnythingModel #MetaAI #обработка изображений #обработка видео #machinelearning #deeplearning #computerVision #pythonprogramming..
YOLO v3 для обнаружения объектов
Мягкий подход
Что такое YOLO v3?
YOLO v3 – это популярная сверточная нейронная сеть (CNN) для обнаружения объектов в реальном времени , опубликованная в 2018 году компанией J. . Редмон и др. На момент своего выпуска он представлял собой современный инструмент для решения этой задачи, обеспечивая точную и быструю работу, как никогда раньше, и даже сегодня он по-прежнему является более чем действенным инструментом. С графическим процессором Titan X он может эффективно..
Резюме статьи ResNet
ResNet — это статья, в которой представлена новая архитектура для распознавания изображений, вот полная статья .
Проблема
Многие из моделей до использования ResNet просто добавляли все больше и больше слоев, и результаты модели были бы, по крайней мере, такими же хорошими, как и более мелкая модель. Логика этого заключается в том, что более глубокая модель имеет все те же части, что и поверхностная модель, плюс еще больше.
Неглубокая модель
Глубокая модель
Чтобы глубокая..
Обучение Tesseract OCR 5 в Docker 🐳
В этом руководстве представлены пошаговые инструкции по обучению Tesseract 5 в контейнере Docker. Docker позволяет создать воспроизводимую среду для обучения моделей Tesseract OCR. Следуя шагам, описанным ниже, вы можете настроить контейнер Docker с Ubuntu, установить Tesseract 5 и необходимые инструменты обучения, получить данные обучения, упорядочить данные и начать процесс обучения.
Создать контейнер Ubuntu
1. Откройте терминал.
2. Извлеките образ Ubuntu Docker:
docker pull..