Ситуация
У меня есть сайт, написанный на PHP.
В PHP я могу извлечь текст из pdf-файла, загруженного на тот же веб-сайт, и так далее.
Я нашел репозиторий tabula-java на github.
Так в чем проблема?
Я попробовал приложение Mac для табулы. Я заметил, что мне нужно выделить определенный раздел PDF-файла, прежде чем данные таблицы можно будет преобразовать.
Однако это не то, чего я хочу добиться. Я хочу запускать tabula в фоновом режиме и по запросу. Когда мой веб-сайт получает загрузку файла и выполняются определенные условия, я хочу каким-то образом вызвать таблицу как услугу и передать ей неструктурированные данные, а затем вернуть табличные данные.
Как мне это сделать?