Я пытаюсь извлечь имена полей и соответствующие значения полей из формы PDF с электронной подписью, которую я загрузил в Adobe Sign и получил электронные подписи. См. ссылку: https://documentcloud.adobe.com/us/en/.
До загрузки формы PDF это была форма Acroform, то есть редактируемый PDF-файл, содержащий поля формы.
Из PDF-файла Acroform мне удалось извлечь имя поля и значения поля с помощью PDFTK. Кроме того, после подписания этой формы в Adobe Reader, хотя PDF больше не редактируется (поля становятся заблокированными), я все еще могу использовать PDFTK для извлечения данных из документа PDF.
Однако после использования Adobe Sign для запроса и получения подписей я изо всех сил пытаюсь извлечь имена и значения полей с помощью PDFTK и Python. Adobe Sign отдельно предоставляет поля формы, но я ищу решение, которое использует Python (который может включать команды оболочки, такие как PDFTK, в скрипте .py) для извлечения имен и значений полей из самого документа PDF с электронной подписью.
Может ли кто-нибудь предложить решение с использованием Python для извлечения имен полей и соответствующих им значений для этого документа (включая поля, которые оставлены пустыми)?
Попытка использовать следующую подписанную Adobe PDF-форму: https://drive.google.com/file/d/1r57yrPuvzYlXwg-0KPM9UQGhu8jgWcUs/view?usp=sharing (подписано с помощью Adobe Sign) https://drive.google.com/file/d/12NUyk7Jku4O1owBboyiCmk2ckpq8g26T/view?usp=sharing (без подписи)
Я пробовал это и для другого Acroform, но столкнулся с той же проблемой. https://www.pruadviser.co.uk/pdf/PIPF10000.pdf