Вопросы по теме 'pdfbox'

Как получить текст и форматирование из таблицы PDF с помощью PDFBox?
Возможный дубликат: Анализ файлов PDF (особенно с таблицами) с PDFBox Я использую PDFBox для анализа текста с помощью C # из файла PDF. Это нормально работает, но когда парсер сталкивается с таблицей, он разбирает текст и разрушает...
947 просмотров
schedule 14.05.2023

Построить PDFBox FAILURE в jempbox
Я обнаружил, что pdfbox-1.6.0.jar не работает в моей системе, поэтому я попытался собрать его из исходного кода и установил Maven. Я получил эту ошибку при сборке в Windows XP или Fedora 15: Tests run: 8, Failures: 1, Errors: 0, Skipped: 0,...
256 просмотров
schedule 24.04.2023

PDFBox не распознает ссылку
Я использую Apache PDFBox для сканирования PDF-файлов в поисках ссылок на определенный файл. Мне нужно отсканировать около тысячи PDF-файлов, и большинство ссылок (фактически все, кроме одной, насколько я вижу сейчас) найдены. Однако в...
1277 просмотров
schedule 07.10.2022

PDFBox извлечение абзацев
Я новичок в pdfbox и хочу извлечь абзац, который соответствует некоторым конкретным словам, и я могу извлечь весь pdf в текст (блокнот), но я понятия не имею, как извлечь конкретный абзац в мою программу Java. Может ли кто-нибудь помочь мне с этим,...
13904 просмотров
schedule 18.11.2023

Pdfbox как извлечь тип и стиль шрифта из pdf
Как получить атрибуты стиля шрифта из pdf с помощью pdfbox
3621 просмотров
schedule 30.04.2022

Как обрезать каждую страницу в формате PDF с помощью PDFBOX в Java?
Я хочу удалить нижнюю часть каждой страницы в PDF, но не изменить размер страницы, как это рекомендуется сделать в java в PDFBOX? Как удалить нижний колонтитул с каждой страницы в PDF? Есть ли способ использовать PDRectangle, чтобы просто удалить...
5841 просмотров
schedule 13.07.2023

Абзац в PDFbox
У меня есть требование изменить файл PDF с помощью iText на PDFbox. У меня есть следующие сомнения: Как создать абзац в поле PDF? (новый абзац в iText) Как придать цвет шрифту в PDFbox? ( Font.BOLD , new Color(79, 129, 189)) в iText)...
1579 просмотров
schedule 19.02.2023

Java PDFBox, как получить объект File из PDDocument
Я пытаюсь получить экземпляр File или InputStream из PDDocument без сохранения PDDocument в файловой системе. PDDocument doc= new PDDocument(); ... doc.save("D:\\document.pdf"); File f= new File("D:\\document.pdf"); Есть...
19872 просмотров
schedule 20.02.2024

Извлечение встроенных файлов из pdf с помощью pdfbox в приложении .NET
Я разрабатываю приложение .NET, используя pdfbox для извлечения метаданных, содержимого и прикрепленного файла из PDF. Мне удалось извлечь метаданные и содержимое, но застрял при извлечении прикрепленных/встроенных файлов. У меня есть PDF-файл со...
1145 просмотров
schedule 01.04.2022

Как использовать PDFBox с Eclipse? Упаковывает ли он в файлы jar?
Я пишу Java-программу в eclipse, которая будет читать в файле PDF, анализировать строки отчета в формате PDF и выдавать статистику о том, что было прочитано. Чтобы прочитать в файле PDF (путем извлечения текста), я использую PDFbox. Цель этого...
10006 просмотров
schedule 10.09.2022

PDFBox - гарантируется ли порядок чтения с помощью processTextPosition PDFTextStripper?
Я использую PdfTextStripper (PDFBox 1.8.2) для обработки каждого TextPosition в файле PDF. Я протестировал множество файлов и заметил, что он обрабатывает текст в порядке чтения. Однако это не работает, если в pdf есть нижние колонтитулы (docx,...
2054 просмотров
schedule 19.03.2023

Как проверить, защищен ли PDF от печати с помощью pdfbox
Я хочу проверить, защищен ли PDF-файл от печати с помощью PDFBox Java API. Есть ли какой-либо API для этого или любой другой способ добиться этого? Ждем ваших любезных ответов. Арин...
184 просмотров
schedule 25.11.2023

API или itext и PDFBox
Как использовать существующий PDF-файл и заполнить информацию, предоставленную пользователем онлайн или в программе Java. Я знаю, что itext и pdfbox используются, но все они показывают документацию для создания нового PDF-файла, а затем заполняют...
626 просмотров
schedule 06.07.2022

цифровая подпись с помощью pdfbox
Я пытаюсь добавить несколько подписей в свой PDF-файл с помощью pdfbox, я пытаюсь использовать две подписи, и вторая подпись всегда оказывается недействительной. Пожалуйста, посоветуйте, может ли PDF-файл быть подписан цифровым образом несколько раз?...
10836 просмотров
schedule 07.10.2022

Редактировать изображения в файле PDF с помощью объекта COSStream
Я пытаюсь редактировать изображения в файле PDF, используя библиотеку PDFBox. Как у меня пример работает только для изображений jpeg. ImageIO.read() не может декодировать изображения с суффиксом «png». Вот пример кода. Итак, мой вопрос: как...
1246 просмотров
schedule 08.07.2022

Перемещение OCR из PDF в другой — Java
Добрый день, у меня проблема в моем проекте, это сжатие PDF, процесс выглядит следующим образом: Извлечение изображений из PDF Зависание OCR Compression Stock OCR + Объединение изображения и преобразование PDF на страницу Объединение всех...
97 просмотров
schedule 30.06.2022

Удалить поле ID из PDF с помощью Apache PDFBox
Мне нужно сравнить с PDF-документами, которые были созданы с помощью iText. Мне действительно удалось сравнить документы, но я спотыкаюсь о крошечную разницу. При открытии PDF-файлов в редакторе, таком как Notepad ++, я вижу, что в конце файла...
888 просмотров
schedule 14.09.2022

PdfBox - кодировка в извлеченном тексте
Некоторые PDF-файлы содержат текст со «странной» кодировкой. Например. там http://www.iwb.ch/media/Unternehmen/Documente/inserat_leiter_pm.pdf Если я скопирую текст, например, в Acrobat Reader и вставлю куда-нибудь, я не получу те символы, которые...
376 просмотров
schedule 14.01.2023

Выделите текст с помощью PDFbox
Привет, я новичок в Pdfbox , и я хочу выделить определенный характер файлов PDF. Прямо сейчас я могу получить координаты персонажа и хочу выделить его. Я видел по этой ссылке: выделить текст использование pdfbox, когда известно его...
1591 просмотров
schedule 15.03.2023

Как нарисовать строку в определенной позиции на странице PDF в Java с помощью pdfbox?
У меня есть координата PDF (x, y) в качестве входных данных. Мне нужно нарисовать строку с заданной входной координатой [например: - (x, y) = (200 250)]. Я использую pdfbox. Когда я использую описанный ниже метод moveTextPositionByAmount, я не...
7499 просмотров
schedule 24.10.2022