Вопросы по теме 'pdf-to-html'
Преобразование нескольких файлов с помощью pdf2htmlEX
Как вы используете pdf2htmlEX для нескольких файлов или для папки, содержащей файлы PDF?
Я могу прекрасно конвертировать отдельные файлы, но я, очевидно, не хочу запускать команду 100 раз для 100 файлов.
Я ничего не смог найти в документации, и...
429 просмотров
schedule
06.09.2023
PDFDomTree не обнаруживает пробелы при преобразовании файла PDF в HTML
Я использую PDFDomTree с pdfbox-2.0.9 в своем приложении Java для преобразования файла PDF в файл HTML. Следующий код, который я использовал для преобразования pdf.
try {
PDDocument document = PDDocument.load(new File("some path"));...
1195 просмотров
schedule
30.07.2022
Я пытаюсь извлечь данные в виде элементов HTML в python, используя pdfminer.
Я пытаюсь извлечь данные в виде HTML из pdf с помощью pdfminer, хотя мне удалось извлечь текст из того же pdf, теперь я получаю сообщение об ошибке при извлечении данных в формате HTML. Мне нужно дополнительно отфильтровать данные, чтобы...
505 просмотров
schedule
26.05.2023