Статьи по теме ocr

Публикации по теме 'ocr'

Приложение для автоматического распознавания номерных знаков (ANPR)

Меня вдохновили истории успеха блестящих мобильных приложений с ИИ, которые иногда разрабатывают дети младше 15 лет, то и дело появляющиеся в новостях и рекламе. Сказал мне: «Я должен построить такой - это не так просто, как кажется». В качестве варианта использования выбрал автоматическое распознавание номерных знаков. За 2 недели исследований и разработок (не включая развертывание) для любимого проекта я не встретил примеров сквозных приложений ИИ (не говоря уже о том, что я..

Обучение Tesseract OCR 5 в Docker 🐳

В этом руководстве представлены пошаговые инструкции по обучению Tesseract 5 в контейнере Docker. Docker позволяет создать воспроизводимую среду для обучения моделей Tesseract OCR. Следуя шагам, описанным ниже, вы можете настроить контейнер Docker с Ubuntu, установить Tesseract 5 и необходимые инструменты обучения, получить данные обучения, упорядочить данные и начать процесс обучения. Создать контейнер Ubuntu 1. Откройте терминал. 2. Извлеките образ Ubuntu Docker: docker pull..

OCR в Mendix с использованием Tesseract.js Часть 1: Преобразование изображения в текст

Оптическое распознавание символов или оптическое считывание символов (OCR) — это электронное или механическое преобразование изображений печатного, рукописного или печатного текста в машинно-кодированный текст — будь то отсканированный документ, фотография документа или фотография сцены. Чтобы лучше понять, как работает распознавание символов, см. схему процесса на следующем рисунке. Со стороны конечного пользователя процесс OCR прост — просто обработайте изображение, а затем получите..

Отверстие в сердце OCR

Оптическое распознавание символов (OCR) - это процесс классификации оптических узоров, содержащихся в цифровом изображении, соответствующих буквенно-цифровым или другим символам. Различные методы распознавания символов с помощью того, что сейчас называется современным оптическим распознаванием символов, были распространены еще с 1900-х годов. Это означает, что OCR и многие методы, используемые для его достижения, никоим образом не относятся к подростковому возрасту, и поэтому можно..

Основные технологии облачной модели распознавания голоса Alibaba

Ян Чжицзе — старший эксперт по алгоритмам и главный научный сотрудник по взаимодействию человека и машины в Alibaba Cloud. Его области исследований включают распознавание голоса, синтез голоса, распознавание и проверку говорящего, распознавание рукописного текста OCR и алгоритм машинного обучения. Он долгое время был членом экспертной группы ведущих научных конференций и журналов в области распознавания голоса. Кроме того, он владеет несколькими патентами США и РСТ. В следующей статье..

Вопросы по теме 'ocr'

Не удается распознать отсканированную страницу в формате PDF с греческими словами с помощью PB, EZTWAIN и TOCR 3.0

Я использую PB 10.5.2 и EZTwain 3.30.0.28, XDefs 1.36b1 от Dosadi для сканирования. Также я использую TOCR 3.0 для управления OCR. В функции мы используем следующее среди всех остальных: ... Long ll_acquire (as_path_filename is a function...

403 просмотров

powerbuilder ocr

02.10.2023

Утечка памяти MODI

У меня есть приложение, в котором я использую MODI 2007 для распознавания нескольких многостраничных файлов TIFF. Я обнаружил, что когда я начинаю это с каталога, который содержит несколько хороших, но также и некоторые размолвки, которые нельзя...

1223 просмотров

c# memory-leaks ocr modi

30.03.2022

Генерация шрифта из изображения текста

Можно ли создать определенный набор шрифтов из приведенного ниже изображения? Моя идея состоит в том, чтобы сгенерировать определенный шрифт для приведенного ниже изображения текста, вручную выбрав часть изображения и сопоставив ее с...

1308 просмотров

fonts image-processing ocr

01.11.2023

Tesseract и Php OCR

Я хочу преобразовать большое количество файлов изображений в текст с помощью Tesseract. Я просмотрел их документацию, но не знаю, как это связано с PHP и как мой php-скрипт будет взаимодействовать с tesseract ocr. Я видел другие вопросы, которые...

9756 просмотров

php ocr tesseract

11.04.2023

Обработка изображений - поверните отсканированный документ для выравнивания текста

У меня есть проект OCR C #, в котором я получаю отсканированный документ с текстом в нем, и мне нужно вернуть текст в документе. У меня уже есть решение для разбора текста, однако мы застряли в той части, где отсканированный документ повернут...

4693 просмотров

image c# image-processing ocr pixel

14.03.2024

Оптическое распознавание символов

Привет всем, я пытаюсь создать программу на Java, которая может читать числа на экране, а также распознавать изображения на экране. Мне было интересно, как я могу достичь этого? Шрифт чисел всегда будет одинаковым. Я никогда раньше не...

2066 просмотров

vision ocr

11.02.2023

Распознавать текст в определенной позиции с помощью камеры Iphone

Я хотел бы разработать приложение, которое должно иметь возможность распознавать некоторые числа на компьютерной печатной карточке (расположенной в фиксированных местах карты), а затем отправлять их в веб-службу. Я знаю, что мне следует...

2174 просмотров

iphone camera ocr image-recognition abbyy

24.03.2023

контраст и яркость автоматически (для OCR)

Я ищу алгоритм для автоматической настройки контрастности и яркости изображений, которые после этого будут сканироваться Tesseract (механизм OCR). Вы знаете, возможно ли это?

2377 просмотров

c++ algorithm ocr contrast brightness

28.02.2023

Ошибка распознавания Python, pyPdf, Adobe PDF: неподдерживаемый фильтр /lzwdecode

Мои материалы: python 2.6 64 бит (с установленным pyPdf-1.13.win32.exe). Крыло IDE. Виндовс 7 64 бит. Я получил следующую ошибку: NotImplementedError: неподдерживаемый фильтр /LZWDecode Когда я запустил следующий код: from pyPdf import...

3809 просмотров

python ocr pypdf

01.08.2023

iOS код ввода японского рукописного ввода помогите пожалуйста

У меня есть ряд вопросов о написании кода для iOS и в том числе о распознавании рукописного японского языка. Я новичок, так что будьте снисходительны и считайте меня глупым... Я хотел бы представить японское слово хираганой (японский фонетический...

2502 просмотров

ios iphone ocr handwriting

23.03.2022

Обучение Tesseract 3 распознаванию чисел на реальных изображениях газовых счетчиков

Я пытаюсь научить тессеракт распознавать числа по реальным изображениям газовых счетчиков. Изображения, которые я использую для обучения, сделаны камерой, по этой причине возникает множество проблем: плохое разрешение изображений, размытые...

6817 просмотров

opencv ocr tesseract

12.01.2022

Tesseract-Job: как разобрать изображение, чтобы извлечь из него информацию

доброе утро. прежде всего. Это самое впечатляющее сообщество, которое я когда-либо видел! Ну, несколько дней я размышлял о тройной работе а. получение б. разбор в. хранение количества страниц. Два дня назад я думал, что получение...

714 просмотров

html parsing ocr tesseract perl

26.04.2024

Как отличить фото от текстового изображения

Я пишу программу распознавания OCR. Он отлично работает с отсканированными текстами, однако есть две проблемы: Дает ложные срабатывания на фото (какая-то ерунда случайный текст типа "bkigopes") работает довольно медленно Цель состоит в...

424 просмотров

algorithm image-processing statistics ocr

04.09.2023

Реализация OCR документов Google iphone

Я пытаюсь интегрировать функцию распознавания документов Google в свое приложение для iPhone. Ниже приведено то, что говорится в документации Google Docs. Чтобы выполнить распознавание текста в файле .pdf, .jpg, .png или .gif, включите параметр...

702 просмотров

iphone google-docs ocr

09.09.2023

Может ли кто-нибудь помочь мне со сканером визитных карточек в Android?

Я новичок в области Android. Я хочу сделать сканер визитных карточек, связанный с OCR в Android. Для этого я использую ссылку на этот сайт. http://mindtherobot.com/blog/452/android-beginners-ndk-setup-step-by-step/ теперь на базе этого...

8183 просмотров

android-emulator android ocr

14.11.2023

tesseract-ocr как включить baseapi.h

Я следовал инструкциям, которые нашел в форме tessesract, о том, как включить baseapi.h. я использую: vs2010 Версия tesseract 3.01 я пытаюсь понять, как использовать baseapi.h. тестовая программа: #define __MSW32__ #include...

12942 просмотров

c++ visual-studio-2010 api ocr tesseract

02.03.2023

Распознавание текста с помощью жестов, OCR или на основе жестов, встроенная библиотека .NET

Я работаю над проектом для Windows Phone 7, и мне нужна библиотека для распознавания фигур в текст. Текущая задача очень проста. У меня есть холст, и я использую событие Touch.FrameReported для обнаружения точек и просто добавляю их в Polyline...

2496 просмотров

.net c# gesture-recognition ocr windows-phone-7

22.10.2023

iphone: SDK для чтения визитных карточек, кроме ABBY

Я делаю приложение, в котором мне требуется устройство для чтения визитных карточек, которое я много гуглил, но BBY - единственное решение, которое я смог найти. Может ли кто-нибудь помочь мне с какой-нибудь библиотекой с открытым исходным кодом,...

2100 просмотров

iphone ocr

28.07.2023

Где мы размещаем языковые файлы tesseract ocr engine в приложении для Android?

Я программирую приложение в Android, которое использует OCR. Я использую tesseract ocr и хочу спросить, куда мне поместить языковые файлы в моем проекте, чтобы, когда я устанавливаю свое приложение на свой телефон (Samsung Galaxy S), файлы были...

1515 просмотров

android ocr tesseract

07.06.2023

Путь с открытым исходным кодом к приложению OCR для обработки изображений в реальном времени?

У меня есть приложение, которое я хочу создать. У нас есть настенные доски расписаний, которые разделены на маленькие прямоугольники черными линиями на белом фоне. Магнитные бирки с именами размещаются в определенном разделе, чтобы указать, что этот...

3991 просмотров

computer-vision open-source image-processing ocr

21.06.2022