Извлечение данных поля формы из Adobe Signed (электронной подписи) Acroforms с использованием Python

Я пытаюсь извлечь имена полей и соответствующие значения полей из формы PDF с электронной подписью, которую я загрузил в Adobe Sign и получил электронные подписи. См. ссылку: https://documentcloud.adobe.com/us/en/.

До загрузки формы PDF это была форма Acroform, то есть редактируемый PDF-файл, содержащий поля формы.

Из PDF-файла Acroform мне удалось извлечь имя поля и значения поля с помощью PDFTK. Кроме того, после подписания этой формы в Adobe Reader, хотя PDF больше не редактируется (поля становятся заблокированными), я все еще могу использовать PDFTK для извлечения данных из документа PDF.

Однако после использования Adobe Sign для запроса и получения подписей я изо всех сил пытаюсь извлечь имена и значения полей с помощью PDFTK и Python. Adobe Sign отдельно предоставляет поля формы, но я ищу решение, которое использует Python (который может включать команды оболочки, такие как PDFTK, в скрипте .py) для извлечения имен и значений полей из самого документа PDF с электронной подписью.

Может ли кто-нибудь предложить решение с использованием Python для извлечения имен полей и соответствующих им значений для этого документа (включая поля, которые оставлены пустыми)?

Попытка использовать следующую подписанную Adobe PDF-форму: https://drive.google.com/file/d/1r57yrPuvzYlXwg-0KPM9UQGhu8jgWcUs/view?usp=sharing (подписано с помощью Adobe Sign) https://drive.google.com/file/d/12NUyk7Jku4O1owBboyiCmk2ckpq8g26T/view?usp=sharing (без подписи)

Я пробовал это и для другого Acroform, но столкнулся с той же проблемой. https://www.pruadviser.co.uk/pdf/PIPF10000.pdf


person AIBball    schedule 07.06.2021    source источник


Ответы (1)


Вы не сможете извлечь имена полей или значения из подписанного Adobe PDF-файла, поскольку в документе больше нет полей. Это сплющенный PDF. Единственным полем в документе является поле цифровой подписи, которое содержит сертификат. Единственный вариант — использовать API Adobe Sign для ПОЛУЧЕНИЯ данных поля в виде CSV-файла по адресу...

/agreements/{agreementId}/formData

person joelgeraci    schedule 07.06.2021
comment
1) Можно ли вообще развернуть PDF, чтобы восстановить поля формы? 2) Не могли бы вы предоставить мне дополнительную информацию о том, как использовать API Adobe Sign для получения полевых данных и получения идентификатора соглашения для большого набора PDF-файлов с электронной подписью? 3) Какова полная длина адреса для /agreements/{agreementId}/formData? 4) Есть ли у вас какие-либо предложения по извлечению имен и значений формы плоской формы PDF с помощью Python? (Это происходит в том случае, если предоставленная форма PDF сглажена и данные формы недоступны или не могут быть переданы). - person AIBball; 08.06.2021
comment
1) Нет. Невозможно. 2) Вы можете найти это здесь: noreferrer">secure.na1.echosign.com/public/docs/restapi/ 3) См. выше 4) Плоская форма не имеет полей. Вот что значит квартира. Когда я писал, что использование Sign API — ваш единственный вариант, я имел в виду только. - person joelgeraci; 08.06.2021