Как вызвать tabula-java из другой программы, написанной на php?

Ситуация

У меня есть сайт, написанный на PHP.

В PHP я могу извлечь текст из pdf-файла, загруженного на тот же веб-сайт, и так далее.

Я нашел репозиторий tabula-java на github.

Так в чем проблема?

Я попробовал приложение Mac для табулы. Я заметил, что мне нужно выделить определенный раздел PDF-файла, прежде чем данные таблицы можно будет преобразовать.

Однако это не то, чего я хочу добиться. Я хочу запускать tabula в фоновом режиме и по запросу. Когда мой веб-сайт получает загрузку файла и выполняются определенные условия, я хочу каким-то образом вызвать таблицу как услугу и передать ей неструктурированные данные, а затем вернуть табличные данные.

Как мне это сделать?


person Kim Stacks    schedule 22.04.2016    source источник


Ответы (1)


Один из способов — обернуть команду командной строки tabula-extractor и вернуть результаты в приложение.

Например, в R так работает пакет tabulizer.

person psychemedia    schedule 02.05.2016