Вопросы по теме 'jsoup'

Jsoup: как получить абсолютный URL-адрес изображения?
Есть ли способ в jsoup извлечь абсолютный URL-адрес изображения, как можно получить абсолютный URL-адрес ссылки? Рассмотрим следующий элемент изображения, найденный в http://www.example.com/ <img src="images/chicken.jpg" width="60px"...
35421 просмотров
schedule 13.06.2023

Извлечение информации с веб-страницы с помощью Jsoup
Я хочу извлечь информацию об обзоре и рейтинге со страницы buy.com с помощью Jsoup. Проблема в том, что я не могу понять, как это сделать, потому что идентификатор каждого обзора отличается в зависимости от его номера. Например отзыв номер 11...
1265 просмотров
schedule 22.01.2024

Проблемы с подключением Android JSoup
Используя руководство на веб-сайте JSoup, я написал следующий код: @Override public void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); try { Document doc = Jsoup.connect("http://google.com").get();...
997 просмотров
schedule 05.02.2024

Jsoup выбирает данные таблицы
На всю жизнь я не могу понять, как выбрать img src, используя jsoup ссылку, заканчивающуюся на «51u1FaI-FHL._SL500_AA300_.jpg». Я пробовал несколько вещей, но ни одна из них не сработала. Любая помощь? doc1 =...
4732 просмотров
schedule 07.07.2022

Ошибка при разборе строки HTML с помощью Jsoup
Я делаю приложение для Android и использую JRE 6 и последнюю библиотеку jSoup. Я пытаюсь разобрать строку, содержащую HTML, используя следующий метод: public static String html2text(String html) { return Jsoup.parse(html).text(); } Я...
1235 просмотров
schedule 29.12.2023

Jsoup: как получить весь html между двумя тегами заголовка
Я пытаюсь получить весь html между двумя тегами h1. Актуальная задача состоит в том, чтобы разбить html на фреймы (главы) на основе тегов h1 (заголовок 1). Цените любую помощь. Спасибо, Сунил.
10114 просмотров
schedule 06.03.2023

Jsoup перестает анализировать веб-страницу
Jsoup.parse(String html) перестает работать. У меня есть приложение, когда я несколько раз использую jsoup для анализа разных страниц, но когда я хочу проанализировать большую страницу, jsoup просто останавливается, и все. Есть ли у него ограничение...
918 просмотров
schedule 03.08.2022

Извлечение текста между двумя тегами ‹hr› в HTML без CSS
Использование Jsoup, что было бы оптимальным подходом для извлечения текста, шаблон которого известен ( [number]%%[number] ), но находится на HTML-странице, которая не использует ни CSS, ни div, span, классы или другую идентификацию любого типа (ага,...
1177 просмотров
schedule 01.04.2023

как поддерживать переменные файлы cookie и сеансы с помощью jsoup?
public boolean isGood(String path) { if (p != path) { good = false; } if (good) { try { Connection connection = Jsoup.connect(path); Map<String, String> cookys =...
14823 просмотров
schedule 04.04.2024

JSoup анализирует HTML
Я пытаюсь проанализировать неправильно сформированный html-файл DTD, который я получаю с помощью входного потока с помощью JSOUP, и получить все данные в полях TD. Как я могу сделать это с JSoup? Я уже просмотрел http://jsoup.org/cookbook/ , но мне...
12077 просмотров
schedule 03.12.2023

Почему Jsoup не может выбрать элемент td?
Я сделал небольшой тест (с Jsoup 1.6.1): String s = "" +Jsoup.parse("<td></td>").select("td").size(); System.out.println("Selected elements count : " + s); Он выводит: Selected elements count : 0 Но он должен вернуть 1,...
1993 просмотров
schedule 21.07.2023

Попытка повторить успешный запрос POST с помощью JSoup - данные, отправленные на сервер, не декодируются
Заголовок HTTP-запроса: Host: www.mysite.com Content-Type: application/x-www-form-urlencoded Cookie: bbuserid=XXX; bbpassword=YYY; bbsessionhash=ZZZ Content-Length: 252 Тело HTTP-запроса:...
5459 просмотров
schedule 17.11.2022

Jsoup не может получить полный контент с веб-страницы (нет ошибок/исключений, но пропускает часть контента)
Я пытаюсь получить содержимое со следующей страницы с помощью JSOUP: http://www.exchangeandmart.co.uk/used-cars-for-sale Но он не извлекает div с id=results, хотя он виден, когда я открываю ту же ссылку из браузера. Помогите пожалуйста мне...
2564 просмотров
schedule 29.01.2024

Как написать символ амперсанда в Jsoup
Я использую Jsoup для анализа и изменения HTML. В некоторых местах я хочу добавить в HTML неразрывный пробел (). Я предположил, что смогу сделать это, как в этом упрощенном примере: Element paragraph = someDocument.select("p").first();...
1368 просмотров
schedule 16.09.2022

JSOUP Поиск групп слов
В качестве домашнего задания мне нужно написать программу, которая удаляет HTML-код с веб-сайта, а затем каким-то образом находит фразы на веб-сайте. Когда я говорю фразы, я имею в виду какой-то произвольный способ организации текста, когда слова,...
923 просмотров
schedule 30.04.2024

JSoup - получение URL-адреса из метаданных
У меня есть HTML-код, который выглядит так. <html><head><meta http-equiv="refresh" content="0;url=http://www.abc.com/event"/></head></html> Я хочу использовать JSoup для анализа этого HTML и получения значения...
6741 просмотров
schedule 28.01.2023

Пожалуйста, помогите с кодом простого селектора Jsoup
Мне трудно получить нужную информацию из очень простого кода. Например, у меня нет проблем со сбором данных в этом простом коде: <HTML> <TABLE> <TABLE WIDTH=100%><TR class=FSS-data-row-highlight>...
202 просмотров
schedule 10.05.2022

jsoup — извлечь текст из статьи в Википедии
Я пишу некоторый код Java, чтобы реализовать задачи НЛП над текстами с использованием Википедии. Как я могу использовать JSoup для извлечения всего текста статьи из Википедии (например, всего текста в http://en.wikipedia.org/wiki/Boston )?
6942 просмотров
schedule 12.10.2022

получение значения атрибута из тега Div через jSoup
У меня есть тег Div, как показано ниже <div id="eventTTL" style="text-transform: uppercase; font-weight: 900;" eventTTL="4583476000">5 days 07:14:41</div> Как мне узнать значение eventTTL? Я хочу отобразить значение eventTTL,...
17546 просмотров
schedule 08.08.2022

Использование jsoup для обхода запрещенных тегов
Я оцениваю jsoup на предмет функциональности, которая будет очищать (но не удалять!) теги, не внесенные в белый список. Допустим, разрешен только тег <b> , поэтому следующий ввод foo <b>bar</b> <script...
3699 просмотров
schedule 14.05.2022