Библиотека pdf2Image не может прочитать PDF-файл, подписанный с помощью docusign

Я пытаюсь преобразовать PDF-файл, подписанный с помощью docusign, в формат изображения. Мы столкнулись с ошибкой в ​​методе convert_from_path. Код и ошибка показаны ниже

импорт pdf2image

data = pdf2image.convert_from_path ('name.pdf')

PDFPageCountError: невозможно получить количество страниц. Синтаксическая ошибка: Gen внутри таблицы внешних ссылок слишком велик (больше INT_MAX) Синтаксическая ошибка: не удалось найти словарь трейлера Синтаксическая ошибка: недопустимая запись XRef Синтаксическая ошибка: недопустимая запись XRef Ошибка синтаксиса: объект страниц верхнего уровня неправильного типа (null) Команда Ошибка строки: указан неверный диапазон страниц: первая страница (1) не может быть после последней страницы (0).


person Karthik B.G    schedule 15.03.2021    source источник


Ответы (2)


Эта проблема связана с более старой версией poppler. Обновление до последней версии (21.03.0) решает проблему.

person thijs123    schedule 23.03.2021
comment
Это проблема: gitlab.freedesktop.org/poppler/poppler/-/issues/ 1014 - person Bohumir Zamecnik; 22.04.2021

Вам нужно будет связаться с Pdf2Image для возможного решения, похоже, обновление должно исправить это

person IvanD    schedule 24.03.2021