Заполняемое преобразование PDF в XML в MarkLogic

Я загрузил несколько файлов PDF в MarkLogic с помощью MLCP, которые затем были преобразованы в XML с помощью преобразования PDF по умолчанию CPF. Некоторые из PDF-файлов можно было заполнить, но ни один из заполненных материалов не был включен в преобразование. Есть ли способ преобразовать это?


person MGlos    schedule 05.03.2019    source источник


Ответы (1)


Являются ли эти PDF-формы заполненными пользователем? Если это так, некоторые конвертеры не передают данные формы PDF. PDFTables могут работать - API позволяет вам конвертировать ваши PDF-файлы в XML, включая любые данные формы.

В качестве примера на Python (можно использовать любой язык):

import pdftables_api

c = pdftables_api.Client('my-api-key')

c.xml('input.pdf', 'output.xml')
person mskel4    schedule 07.03.2019
comment
Да, это PDF-формы, заполненные пользователем. Делает ли это какой-либо из конвертеров MarkLogic PDF, или это единственный вариант конвертировать перед загрузкой в ​​MarkLogic? - person MGlos; 12.03.2019
comment
Я не знаком с MarkLogic, но, исходя из того, что вы сказали в своем первоначальном вопросе, я предполагаю, что данные формы не переносятся. - person mskel4; 13.03.2019