Публикации по теме 'ocr'


Приложение для автоматического распознавания номерных знаков (ANPR)
Меня вдохновили истории успеха блестящих мобильных приложений с ИИ, которые иногда разрабатывают дети младше 15 лет, то и дело появляющиеся в новостях и рекламе. Сказал мне: «Я должен построить такой - это не так просто, как кажется». В качестве варианта использования выбрал автоматическое распознавание номерных знаков. За 2 недели исследований и разработок (не включая развертывание) для любимого проекта я не встретил примеров сквозных приложений ИИ (не говоря уже о том, что я..

Обучение Tesseract OCR 5 в Docker 🐳
В этом руководстве представлены пошаговые инструкции по обучению Tesseract 5 в контейнере Docker. Docker позволяет создать воспроизводимую среду для обучения моделей Tesseract OCR. Следуя шагам, описанным ниже, вы можете настроить контейнер Docker с Ubuntu, установить Tesseract 5 и необходимые инструменты обучения, получить данные обучения, упорядочить данные и начать процесс обучения. Создать контейнер Ubuntu 1. Откройте терминал. 2. Извлеките образ Ubuntu Docker: docker pull..

OCR в Mendix с использованием Tesseract.js Часть 1: Преобразование изображения в текст
Оптическое распознавание символов или оптическое считывание символов (OCR) — это электронное или механическое преобразование изображений печатного, рукописного или печатного текста в машинно-кодированный текст — будь то отсканированный документ, фотография документа или фотография сцены. Чтобы лучше понять, как работает распознавание символов, см. схему процесса на следующем рисунке. Со стороны конечного пользователя процесс OCR прост — просто обработайте изображение, а затем получите..

Отверстие в сердце OCR
Оптическое распознавание символов (OCR) - это процесс классификации оптических узоров, содержащихся в цифровом изображении, соответствующих буквенно-цифровым или другим символам. Различные методы распознавания символов с помощью того, что сейчас называется современным оптическим распознаванием символов, были распространены еще с 1900-х годов. Это означает, что OCR и многие методы, используемые для его достижения, никоим образом не относятся к подростковому возрасту, и поэтому можно..

Основные технологии облачной модели распознавания голоса Alibaba
Ян Чжицзе — старший эксперт по алгоритмам и главный научный сотрудник по взаимодействию человека и машины в Alibaba Cloud. Его области исследований включают распознавание голоса, синтез голоса, распознавание и проверку говорящего, распознавание рукописного текста OCR и алгоритм машинного обучения. Он долгое время был членом экспертной группы ведущих научных конференций и журналов в области распознавания голоса. Кроме того, он владеет несколькими патентами США и РСТ. В следующей статье..

Вопросы по теме 'ocr'

Не удается распознать отсканированную страницу в формате PDF с греческими словами с помощью PB, EZTWAIN и TOCR 3.0
Я использую PB 10.5.2 и EZTwain 3.30.0.28, XDefs 1.36b1 от Dosadi для сканирования. Также я использую TOCR 3.0 для управления OCR. В функции мы используем следующее среди всех остальных: ... Long ll_acquire (as_path_filename is a function...
403 просмотров
schedule 02.10.2023

Утечка памяти MODI
У меня есть приложение, в котором я использую MODI 2007 для распознавания нескольких многостраничных файлов TIFF. Я обнаружил, что когда я начинаю это с каталога, который содержит несколько хороших, но также и некоторые размолвки, которые нельзя...
1223 просмотров
schedule 30.03.2022

Генерация шрифта из изображения текста
Можно ли создать определенный набор шрифтов из приведенного ниже изображения? Моя идея состоит в том, чтобы сгенерировать определенный шрифт для приведенного ниже изображения текста, вручную выбрав часть изображения и сопоставив ее с...
1308 просмотров
schedule 01.11.2023

Tesseract и Php OCR
Я хочу преобразовать большое количество файлов изображений в текст с помощью Tesseract. Я просмотрел их документацию, но не знаю, как это связано с PHP и как мой php-скрипт будет взаимодействовать с tesseract ocr. Я видел другие вопросы, которые...
9756 просмотров
schedule 11.04.2023

Обработка изображений - поверните отсканированный документ для выравнивания текста
У меня есть проект OCR C #, в котором я получаю отсканированный документ с текстом в нем, и мне нужно вернуть текст в документе. У меня уже есть решение для разбора текста, однако мы застряли в той части, где отсканированный документ повернут...
4693 просмотров
schedule 14.03.2024

Оптическое распознавание символов
Привет всем, я пытаюсь создать программу на Java, которая может читать числа на экране, а также распознавать изображения на экране. Мне было интересно, как я могу достичь этого? Шрифт чисел всегда будет одинаковым. Я никогда раньше не...
2066 просмотров
schedule 11.02.2023

Распознавать текст в определенной позиции с помощью камеры Iphone
Я хотел бы разработать приложение, которое должно иметь возможность распознавать некоторые числа на компьютерной печатной карточке (расположенной в фиксированных местах карты), а затем отправлять их в веб-службу. Я знаю, что мне следует...
2174 просмотров
schedule 24.03.2023

контраст и яркость автоматически (для OCR)
Я ищу алгоритм для автоматической настройки контрастности и яркости изображений, которые после этого будут сканироваться Tesseract (механизм OCR). Вы знаете, возможно ли это?
2377 просмотров
schedule 28.02.2023

Ошибка распознавания Python, pyPdf, Adobe PDF: неподдерживаемый фильтр /lzwdecode
Мои материалы: python 2.6 64 бит (с установленным pyPdf-1.13.win32.exe). Крыло IDE. Виндовс 7 64 бит. Я получил следующую ошибку: NotImplementedError: неподдерживаемый фильтр /LZWDecode Когда я запустил следующий код: from pyPdf import...
3809 просмотров
schedule 01.08.2023

iOS код ввода японского рукописного ввода помогите пожалуйста
У меня есть ряд вопросов о написании кода для iOS и в том числе о распознавании рукописного японского языка. Я новичок, так что будьте снисходительны и считайте меня глупым... Я хотел бы представить японское слово хираганой (японский фонетический...
2502 просмотров
schedule 23.03.2022

Обучение Tesseract 3 распознаванию чисел на реальных изображениях газовых счетчиков
Я пытаюсь научить тессеракт распознавать числа по реальным изображениям газовых счетчиков. Изображения, которые я использую для обучения, сделаны камерой, по этой причине возникает множество проблем: плохое разрешение изображений, размытые...
6817 просмотров
schedule 12.01.2022

Tesseract-Job: как разобрать изображение, чтобы извлечь из него информацию
доброе утро. прежде всего. Это самое впечатляющее сообщество, которое я когда-либо видел! Ну, несколько дней я размышлял о тройной работе а. получение б. разбор в. хранение количества страниц. Два дня назад я думал, что получение...
714 просмотров
schedule 26.04.2024

Как отличить фото от текстового изображения
Я пишу программу распознавания OCR. Он отлично работает с отсканированными текстами, однако есть две проблемы: Дает ложные срабатывания на фото (какая-то ерунда случайный текст типа "bkigopes") работает довольно медленно Цель состоит в...
424 просмотров

Реализация OCR документов Google iphone
Я пытаюсь интегрировать функцию распознавания документов Google в свое приложение для iPhone. Ниже приведено то, что говорится в документации Google Docs. Чтобы выполнить распознавание текста в файле .pdf, .jpg, .png или .gif, включите параметр...
702 просмотров
schedule 09.09.2023

Может ли кто-нибудь помочь мне со сканером визитных карточек в Android?
Я новичок в области Android. Я хочу сделать сканер визитных карточек, связанный с OCR в Android. Для этого я использую ссылку на этот сайт. http://mindtherobot.com/blog/452/android-beginners-ndk-setup-step-by-step/ теперь на базе этого...
8183 просмотров
schedule 14.11.2023

tesseract-ocr как включить baseapi.h
Я следовал инструкциям, которые нашел в форме tessesract, о том, как включить baseapi.h. я использую: vs2010 Версия tesseract 3.01 я пытаюсь понять, как использовать baseapi.h. тестовая программа: #define __MSW32__ #include...
12942 просмотров
schedule 02.03.2023

Распознавание текста с помощью жестов, OCR или на основе жестов, встроенная библиотека .NET
Я работаю над проектом для Windows Phone 7, и мне нужна библиотека для распознавания фигур в текст. Текущая задача очень проста. У меня есть холст, и я использую событие Touch.FrameReported для обнаружения точек и просто добавляю их в Polyline...
2496 просмотров

iphone: SDK для чтения визитных карточек, кроме ABBY
Я делаю приложение, в котором мне требуется устройство для чтения визитных карточек, которое я много гуглил, но BBY - единственное решение, которое я смог найти. Может ли кто-нибудь помочь мне с какой-нибудь библиотекой с открытым исходным кодом,...
2100 просмотров
schedule 28.07.2023

Где мы размещаем языковые файлы tesseract ocr engine в приложении для Android?
Я программирую приложение в Android, которое использует OCR. Я использую tesseract ocr и хочу спросить, куда мне поместить языковые файлы в моем проекте, чтобы, когда я устанавливаю свое приложение на свой телефон (Samsung Galaxy S), файлы были...
1515 просмотров
schedule 07.06.2023

Путь с открытым исходным кодом к приложению OCR для обработки изображений в реальном времени?
У меня есть приложение, которое я хочу создать. У нас есть настенные доски расписаний, которые разделены на маленькие прямоугольники черными линиями на белом фоне. Магнитные бирки с именами размещаются в определенном разделе, чтобы указать, что этот...
3991 просмотров