Вопросы по теме 'pdf-conversion'

itextsharp PdfTextExtractor Неправильное написание слов
В нашей базе данных есть файл PDF в двоичном формате. Я выложил его в потоковом режиме и сохранил как файл PDF, протестировал с обоими источниками и получил тот же результат: PdfTextExtractor неправильно произносит некоторые слова. Например, в...
1547 просмотров
schedule 24.04.2022

PDFCreator и средство просмотра Excel
Я хотел бы использовать PDFCreator для создания файлов PDF из файлов Excel (.xlsx). Я не могу использовать MS Office. Я скачал PDFCreator и попытался распечатать .docx с помощью команды: PDFCreator.exe /PF"myfile.docx" С этим проблем нет,...
2982 просмотров
schedule 06.03.2024

Проблемы с преобразованием docx в pdf с помощью docx4j
Я использую docx4j 2.8.1 и пытался преобразовать несколько разных файлов docx, но у меня всегда одна и та же проблема. возможно, проблема связана с версией библиотеки или отсутствием какой-либо зависимости. Код: package test; import...
4025 просмотров
schedule 15.12.2023

xmlWorker усекает таблицы внутри DIV
Я использую последнюю версию xmlWorker (5.4.3) для преобразования файла XHTML в PDF . Когда TABLE TAG находится внутри DIV TAG и таблица превышает страницу, таблица усекается... Мне это кажется очень странным. Или нет? Есть идеи?
693 просмотров
schedule 25.07.2022

Dompdf отлично конвертируется на локальном, но не на рабочем сервере
Я использую Laravel 4 с пакетом dompdf: https://github.com/barryvdh/laravel-dompdf Когда я создаю отчет и он преобразует его в PDF на моем локальном компьютере, все в порядке и отображается хорошо, но когда я делаю то же самое на своем рабочем...
1834 просмотров
schedule 01.05.2024

Текстовый редактор Ghostscript сохраняет пустые строки
Я пытаюсь преобразовать PDF-файлы в текстовые файлы. Я использую эту команду для выполнения преобразования: gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=output.txt input.pdf Версия Ghostscript 9.07. Я получаю весь текст, показанный...
153 просмотров

Преобразование pdf-документа, который включает таблицы в файл csv, с использованием python или любого другого языка
Я попытался преобразовать документ pdf (включая таблицы) в файл csv. К сожалению, я потерпел неудачу. Я использовал следующие подходы: Используемый pdfminer сначала преобразовал pdf в текст, но структура текстового файла не такая, как у...
771 просмотров
schedule 18.01.2022

org.apache.poi.xwpf.converter.core.XWPFConverterException: java.lang.NullPointerException (Java)
Я получаю сообщение об ошибке конвертации при конвертации docx в pdf. Это мой код: private File convertFileToPdf(MultipartFile file) { try { File docFile = new File(file.getOriginalFilename()); String extension =...
908 просмотров

Как читать таблицу?
У меня есть расписание в формате PDF. (1) (2) (3) 09:00 10:30 11:30 Monday 12C 11B 10A Tuesday 10K 10K 9A Wednesday 7A Thursday 7B 7B Friday 6A...
122 просмотров
schedule 23.03.2024

Преобразование файла .docx в pdf с использованием изображений apache poi
У меня есть текстовый документ .docx, содержащий таблицы, абзацы и изображения. Мне удалось успешно преобразовать файл в pdf, но в файле pdf отсутствуют изображения. Это фрагмент кода, который я использую: ByteArrayOutputStream baos = new...
1211 просмотров
schedule 23.12.2022

Заполняемое преобразование PDF в XML в MarkLogic
Я загрузил несколько файлов PDF в MarkLogic с помощью MLCP, которые затем были преобразованы в XML с помощью преобразования PDF по умолчанию CPF. Некоторые из PDF-файлов можно было заполнить, но ни один из заполненных материалов не был включен в...
83 просмотров

Объединение нескольких страниц PDF в одностраничный PDF
Итак, у меня есть многостраничный PDF-файл, который выглядит примерно так многостраничный В настоящее время это более одной страницы, но я хотел бы объединить. Эти две страницы должны быть объединены таким образом, чтобы они стали одной...
216 просмотров
schedule 15.09.2023

Я пытаюсь извлечь данные в виде элементов HTML в python, используя pdfminer.
Я пытаюсь извлечь данные в виде HTML из pdf с помощью pdfminer, хотя мне удалось извлечь текст из того же pdf, теперь я получаю сообщение об ошибке при извлечении данных в формате HTML. Мне нужно дополнительно отфильтровать данные, чтобы...
505 просмотров

Команда не найдена в вашем пути к классам.
Я использую wkhtmltopdf в своем приложении Java, и когда я пытаюсь отправить HTTP-запрос, я получаю, что команда wkhtmltopdf не найдена в вашем пути к классам. Проверьте его установку или инициализируйте конфигурации оболочки с правильной...
69 просмотров