Вопросы по теме 'pdf-to-html'

Преобразование нескольких файлов с помощью pdf2htmlEX
Как вы используете pdf2htmlEX для нескольких файлов или для папки, содержащей файлы PDF? Я могу прекрасно конвертировать отдельные файлы, но я, очевидно, не хочу запускать команду 100 раз для 100 файлов. Я ничего не смог найти в документации, и...
429 просмотров
schedule 06.09.2023

PDFDomTree не обнаруживает пробелы при преобразовании файла PDF в HTML
Я использую PDFDomTree с pdfbox-2.0.9 в своем приложении Java для преобразования файла PDF в файл HTML. Следующий код, который я использовал для преобразования pdf. try { PDDocument document = PDDocument.load(new File("some path"));...
1195 просмотров
schedule 30.07.2022

Я пытаюсь извлечь данные в виде элементов HTML в python, используя pdfminer.
Я пытаюсь извлечь данные в виде HTML из pdf с помощью pdfminer, хотя мне удалось извлечь текст из того же pdf, теперь я получаю сообщение об ошибке при извлечении данных в формате HTML. Мне нужно дополнительно отфильтровать данные, чтобы...
505 просмотров