Статьи по теме computer-vision

Публикации по теме 'computer-vision'

Как использовать Caire, библиотеку изменения размера изображений с учетом содержимого

Несколько человек жаловались на отсутствие подробных инструкций по использованию моего приложения Go под названием Caire для изменения размера изображения с учетом содержимого. Если вы не слышали о проекте, вы можете ознакомиться с репозиторием здесь: https://github.com/esimov/caire . Подробный технический обзор самого приложения и его реализации есть на моем личном сайте по адресу https://esimov.com/2019/05/caire-a-content-aware-image-resizing-library , но правда в том, что он не..

Классификация продуктов питания

Часть 1 Нейронная сеть Pytorch с нуля Компьютерное зрение (CNN) Компьютерное зрение относится к области искусственного интеллекта и информатики, которая направлена на то, чтобы позволить компьютерам понимать и интерпретировать визуальные данные. Он включает в себя разработку алгоритмов и методов, которые позволяют компьютерам анализировать, обрабатывать и извлекать значимую информацию из изображений или видео. Конечная цель компьютерного зрения — позволить машинам воспринимать и..

Обнаружение рук и подсчет пальцев с использованием OpenCV-Python

Реализация обнаружения рук с использованием OpenCV-Python с теоремой косинуса для задачи подсчета пальцев. Увидев изображение выше, вы очень взволнованы тем, что реализовали его (как и я). Так что, не теряя слишком много времени, перейдем к коду. OpenCV OpenCV (библиотека компьютерного зрения с открытым исходным кодом) - это библиотека программного обеспечения для компьютерного зрения и машинного обучения с открытым исходным кодом. OpenCV был создан для обеспечения общей..

Как использовать SAM —«Модель Segment Anything: пошаговое руководство по сегментации изображений и видео»

https://youtu.be/lvsC8N6QjPg Хотите научиться сегментировать объекты, людей и сцены на изображениях и видео с помощью SAM? Посмотрите наше последнее видеоруководство: «Как использовать модель SAM — Segment Anything: пошаговое руководство по сегментации изображений и видео». Следите за процессом, от настройки Python до передовых методов. #SAM #SegmentAnythingModel #MetaAI #обработка изображений #обработка видео #machinelearning #deeplearning #computerVision #pythonprogramming..

YOLO v3 для обнаружения объектов

Мягкий подход Что такое YOLO v3? YOLO v3 – это популярная сверточная нейронная сеть (CNN) для обнаружения объектов в реальном времени , опубликованная в 2018 году компанией J. . Редмон и др. На момент своего выпуска он представлял собой современный инструмент для решения этой задачи, обеспечивая точную и быструю работу, как никогда раньше, и даже сегодня он по-прежнему является более чем действенным инструментом. С графическим процессором Titan X он может эффективно..

Резюме статьи ResNet

ResNet — это статья, в которой представлена новая архитектура для распознавания изображений, вот полная статья . Проблема Многие из моделей до использования ResNet просто добавляли все больше и больше слоев, и результаты модели были бы, по крайней мере, такими же хорошими, как и более мелкая модель. Логика этого заключается в том, что более глубокая модель имеет все те же части, что и поверхностная модель, плюс еще больше. Неглубокая модель Глубокая модель Чтобы глубокая..

Обучение Tesseract OCR 5 в Docker 🐳

В этом руководстве представлены пошаговые инструкции по обучению Tesseract 5 в контейнере Docker. Docker позволяет создать воспроизводимую среду для обучения моделей Tesseract OCR. Следуя шагам, описанным ниже, вы можете настроить контейнер Docker с Ubuntu, установить Tesseract 5 и необходимые инструменты обучения, получить данные обучения, упорядочить данные и начать процесс обучения. Создать контейнер Ubuntu 1. Откройте терминал. 2. Извлеките образ Ubuntu Docker: docker pull..