Вопросы по теме 'tabula'

Как вызвать tabula-java из другой программы, написанной на php?
Ситуация У меня есть сайт, написанный на PHP. В PHP я могу извлечь текст из pdf-файла, загруженного на тот же веб-сайт, и так далее. Я нашел репозиторий tabula-java на github. Так в чем проблема? Я попробовал приложение Mac для...
1059 просмотров
schedule 16.09.2022

Java-код для выполнения команд
Я хочу выполнять команды инструмента tabula из программы Java. Код, который я пытаюсь: System.setProperty("user.dir", "C:\\Program Files"); String command ="\\tabula\\tabula-0.9.0-SNAPSHOT-jar-with-dependencies.jar "+"D:\\sample.pdf"+" -o...
237 просмотров
schedule 02.08.2023

Ошибка шрифта Tabula-py tahoma при разборе pdf
Я работаю на Debian Jessie. Я пытаюсь проанализировать свой PDF-файл с помощью библиотеки tabula-py , но получаю эту ошибку 2016 12:16:57 PM org.apache.pdfbox.pdmodel.font.PDTrueTypeFont getawtFont 0...
634 просмотров
schedule 03.12.2023

Tabula Py не обнаруживает таблицы в PDF
Я использовал следующий код, но ничего не обнаруживается. Я также пробовал различные другие форматы PDF, но получил тот же результат. from tabula import read_pdf,convert_into...
818 просмотров
schedule 07.09.2023

Python tabula-py не может импортировать оболочку имени
Вот мой код: from tabula import wrapper df = wrapper.read_pdf('singapore.pdf') Но это дает следующую ошибку: ImportError: невозможно импортировать имя "оболочка" Я пробовал его на ubuntu, и он там отлично работает, но в Windows я...
2321 просмотров
schedule 24.11.2022

Почему у модуля «xxx» всегда нет атрибута «xxx»?
я использую pycharm professional, что меня сегодня беспокоит, так это то, что многие модули, которые я вызываю, похоже, не будут работать, например, plotly, tabula-py и camelot. Из прикрепленного рисунка ниже вы можете видеть, что я даже работаю в...
1020 просмотров
schedule 05.12.2023

Tabula-py пропускает первую страницу из PDF и пропускает некоторые табличные данные
Я использую Python (3.8.1) и tabula-py (2.1.0) ( https://tabula-py.readthedocs.io/en/latest/tabula.html#tabula.io.build_options ), чтобы извлечь таблицы из текстового PDF-файла (ежемесячная оплата AWS отчет). Ниже показан образец PDF-файла (нижняя...
472 просмотров
schedule 15.09.2023

Приложение Python flask на сводном облачном литейном заводе выдает ошибку Java
У меня есть приложение python flask, которое использует tabula внутри для извлечения таблиц из файлов PDF. После того, как я делаю «cf push» и запускаю приложение на PCF, я загружаю файл PDF в приложение, чтобы прочитать таблицу. Когда приложение...
108 просмотров
schedule 12.11.2022

Извлечение нескольких таблиц из файла PDF и преобразование его в фреймворк данных с помощью python?
У меня есть 5-страничный файл PDF, на каждой странице есть несколько таблиц, которые мне нужно извлечь. Мне нужно извлечь все таблицы с каждой страницы и сохранить их как файл фрейма данных, используя python. Я пробовал много вещей, но не смог...
35 просмотров
schedule 05.04.2023