Вопросы по теме 'htmlcleaner'

Использование jsoup для обхода запрещенных тегов
Я оцениваю jsoup на предмет функциональности, которая будет очищать (но не удалять!) теги, не внесенные в белый список. Допустим, разрешен только тег <b> , поэтому следующий ввод foo <b>bar</b> <script...
3699 просмотров
schedule 14.05.2022

Создайте файл PDF в соответствующем формате
Для себя я создал PDF-файл, используя библиотеку летающих тарелок. Это был устаревший HTML, поэтому я очистил XHTML с помощью библиотеки HTMLCleaner. После этого я сериализую XML в виде строки, затем передаю его в модуль iText летающей тарелки для...
1406 просмотров
schedule 16.11.2023

Является ли использование HtmlCleaner и Jsoup вместе хорошей идеей?
Итак, я пытаюсь получить некоторые данные с определенного веб-сайта. При первом запуске приложение загружает html-файл определенного веб-сайта и очищает его. private class cleanHtml extends AsyncTask<Void, Void, Void>{ @Override...
879 просмотров
schedule 13.07.2023

Как разобрать html с помощью xpath?
Я столкнулся с несколькими вопросами на StackOverflow, которые касались анализа html с помощью xpath с использованием Java. Это лучший ответ, который я нашел на данный момент здесь . Но похоже, что DomSerializer больше не доступен в Java 11....
128 просмотров
schedule 06.04.2022