Как разобрать html с помощью xpath?

Я столкнулся с несколькими вопросами на StackOverflow, которые касались анализа html с помощью xpath с использованием Java.

Это лучший ответ, который я нашел на данный момент здесь.

Но похоже, что DomSerializer больше не доступен в Java 11.

Как я могу использовать DomSerializer в Java 11?


person Arya    schedule 07.07.2019    source источник


Ответы (1)


Добавьте следующую зависимость к pom.xml :

<dependency>
    <groupId>net.sourceforge.htmlcleaner</groupId>
    <artifactId>htmlcleaner</artifactId>
    <version>2.6.1</version>
</dependency>

Или

Вы можете скачать htmlcleaner-2.6.1.jar с здесь.

Внутри этой банки (или артефакта) находится класс DomSerializer.

Ссылка для чтения документов: http://htmlcleaner.sourceforge.net/doc/org/htmlcleaner/DomSerializer.html

person Anish B.    schedule 07.07.2019