Вопросы по теме 'tabula'
Как вызвать tabula-java из другой программы, написанной на php?
Ситуация
У меня есть сайт, написанный на PHP.
В PHP я могу извлечь текст из pdf-файла, загруженного на тот же веб-сайт, и так далее.
Я нашел репозиторий tabula-java на github.
Так в чем проблема?
Я попробовал приложение Mac для...
1059 просмотров
schedule
16.09.2022
Java-код для выполнения команд
Я хочу выполнять команды инструмента tabula из программы Java. Код, который я пытаюсь:
System.setProperty("user.dir", "C:\\Program Files");
String command ="\\tabula\\tabula-0.9.0-SNAPSHOT-jar-with-dependencies.jar "+"D:\\sample.pdf"+" -o...
237 просмотров
schedule
02.08.2023
Ошибка шрифта Tabula-py tahoma при разборе pdf
Я работаю на Debian Jessie. Я пытаюсь проанализировать свой PDF-файл с помощью библиотеки tabula-py , но получаю эту ошибку
2016 12:16:57 PM org.apache.pdfbox.pdmodel.font.PDTrueTypeFont
getawtFont
0...
634 просмотров
schedule
03.12.2023
Tabula Py не обнаруживает таблицы в PDF
Я использовал следующий код, но ничего не обнаруживается. Я также пробовал различные другие форматы PDF, но получил тот же результат.
from tabula import read_pdf,convert_into...
818 просмотров
schedule
07.09.2023
Python tabula-py не может импортировать оболочку имени
Вот мой код:
from tabula import wrapper
df = wrapper.read_pdf('singapore.pdf')
Но это дает следующую ошибку:
ImportError: невозможно импортировать имя "оболочка"
Я пробовал его на ubuntu, и он там отлично работает, но в Windows я...
2321 просмотров
schedule
24.11.2022
Почему у модуля «xxx» всегда нет атрибута «xxx»?
я использую pycharm professional, что меня сегодня беспокоит, так это то, что многие модули, которые я вызываю, похоже, не будут работать, например, plotly, tabula-py и camelot.
Из прикрепленного рисунка ниже вы можете видеть, что я даже работаю в...
1020 просмотров
schedule
05.12.2023
Tabula-py пропускает первую страницу из PDF и пропускает некоторые табличные данные
Я использую Python (3.8.1) и tabula-py (2.1.0) ( https://tabula-py.readthedocs.io/en/latest/tabula.html#tabula.io.build_options ), чтобы извлечь таблицы из текстового PDF-файла (ежемесячная оплата AWS отчет). Ниже показан образец PDF-файла (нижняя...
472 просмотров
schedule
15.09.2023
Приложение Python flask на сводном облачном литейном заводе выдает ошибку Java
У меня есть приложение python flask, которое использует tabula внутри для извлечения таблиц из файлов PDF. После того, как я делаю «cf push» и запускаю приложение на PCF, я загружаю файл PDF в приложение, чтобы прочитать таблицу. Когда приложение...
108 просмотров
schedule
12.11.2022
Извлечение нескольких таблиц из файла PDF и преобразование его в фреймворк данных с помощью python?
У меня есть 5-страничный файл PDF, на каждой странице есть несколько таблиц, которые мне нужно извлечь. Мне нужно извлечь все таблицы с каждой страницы и сохранить их как файл фрейма данных, используя python.
Я пробовал много вещей, но не смог...
35 просмотров
schedule
05.04.2023