Вопросы по теме 'jsoup'
Jsoup: как получить абсолютный URL-адрес изображения?
Есть ли способ в jsoup извлечь абсолютный URL-адрес изображения, как можно получить абсолютный URL-адрес ссылки?
Рассмотрим следующий элемент изображения, найденный в http://www.example.com/
<img src="images/chicken.jpg" width="60px"...
35421 просмотров
schedule
13.06.2023
Извлечение информации с веб-страницы с помощью Jsoup
Я хочу извлечь информацию об обзоре и рейтинге со страницы buy.com с помощью Jsoup. Проблема в том, что я не могу понять, как это сделать, потому что идентификатор каждого обзора отличается в зависимости от его номера. Например отзыв номер 11...
1265 просмотров
schedule
22.01.2024
Проблемы с подключением Android JSoup
Используя руководство на веб-сайте JSoup, я написал следующий код:
@Override
public void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
try {
Document doc = Jsoup.connect("http://google.com").get();...
997 просмотров
schedule
05.02.2024
Jsoup выбирает данные таблицы
На всю жизнь я не могу понять, как выбрать img src, используя jsoup ссылку, заканчивающуюся на «51u1FaI-FHL._SL500_AA300_.jpg».
Я пробовал несколько вещей, но ни одна из них не сработала. Любая помощь?
doc1 =...
4732 просмотров
schedule
07.07.2022
Ошибка при разборе строки HTML с помощью Jsoup
Я делаю приложение для Android и использую JRE 6 и последнюю библиотеку jSoup. Я пытаюсь разобрать строку, содержащую HTML, используя следующий метод:
public static String html2text(String html) {
return Jsoup.parse(html).text();
}
Я...
1235 просмотров
schedule
29.12.2023
Jsoup: как получить весь html между двумя тегами заголовка
Я пытаюсь получить весь html между двумя тегами h1. Актуальная задача состоит в том, чтобы разбить html на фреймы (главы) на основе тегов h1 (заголовок 1).
Цените любую помощь.
Спасибо, Сунил.
10114 просмотров
schedule
06.03.2023
Jsoup перестает анализировать веб-страницу
Jsoup.parse(String html) перестает работать. У меня есть приложение, когда я несколько раз использую jsoup для анализа разных страниц, но когда я хочу проанализировать большую страницу, jsoup просто останавливается, и все. Есть ли у него ограничение...
918 просмотров
schedule
03.08.2022
Извлечение текста между двумя тегами ‹hr› в HTML без CSS
Использование Jsoup, что было бы оптимальным подходом для извлечения текста, шаблон которого известен ( [number]%%[number] ), но находится на HTML-странице, которая не использует ни CSS, ни div, span, классы или другую идентификацию любого типа (ага,...
1177 просмотров
schedule
01.04.2023
как поддерживать переменные файлы cookie и сеансы с помощью jsoup?
public boolean isGood(String path)
{
if (p != path)
{
good = false;
}
if (good)
{
try
{
Connection connection = Jsoup.connect(path);
Map<String, String> cookys =...
14823 просмотров
schedule
04.04.2024
JSoup анализирует HTML
Я пытаюсь проанализировать неправильно сформированный html-файл DTD, который я получаю с помощью входного потока с помощью JSOUP, и получить все данные в полях TD. Как я могу сделать это с JSoup? Я уже просмотрел http://jsoup.org/cookbook/ , но мне...
12077 просмотров
schedule
03.12.2023
Почему Jsoup не может выбрать элемент td?
Я сделал небольшой тест (с Jsoup 1.6.1):
String s = "" +Jsoup.parse("<td></td>").select("td").size();
System.out.println("Selected elements count : " + s);
Он выводит:
Selected elements count : 0
Но он должен вернуть 1,...
1993 просмотров
schedule
21.07.2023
Попытка повторить успешный запрос POST с помощью JSoup - данные, отправленные на сервер, не декодируются
Заголовок HTTP-запроса:
Host: www.mysite.com
Content-Type: application/x-www-form-urlencoded
Cookie: bbuserid=XXX; bbpassword=YYY; bbsessionhash=ZZZ
Content-Length: 252
Тело HTTP-запроса:...
5459 просмотров
schedule
17.11.2022
Jsoup не может получить полный контент с веб-страницы (нет ошибок/исключений, но пропускает часть контента)
Я пытаюсь получить содержимое со следующей страницы с помощью JSOUP:
http://www.exchangeandmart.co.uk/used-cars-for-sale
Но он не извлекает div с id=results, хотя он виден, когда я открываю ту же ссылку из браузера. Помогите пожалуйста мне...
2564 просмотров
schedule
29.01.2024
Как написать символ амперсанда в Jsoup
Я использую Jsoup для анализа и изменения HTML. В некоторых местах я хочу добавить в HTML неразрывный пробел (). Я предположил, что смогу сделать это, как в этом упрощенном примере:
Element paragraph = someDocument.select("p").first();...
1368 просмотров
schedule
16.09.2022
JSOUP Поиск групп слов
В качестве домашнего задания мне нужно написать программу, которая удаляет HTML-код с веб-сайта, а затем каким-то образом находит фразы на веб-сайте. Когда я говорю фразы, я имею в виду какой-то произвольный способ организации текста, когда слова,...
923 просмотров
schedule
30.04.2024
JSoup - получение URL-адреса из метаданных
У меня есть HTML-код, который выглядит так.
<html><head><meta http-equiv="refresh" content="0;url=http://www.abc.com/event"/></head></html>
Я хочу использовать JSoup для анализа этого HTML и получения значения...
6741 просмотров
schedule
28.01.2023
Пожалуйста, помогите с кодом простого селектора Jsoup
Мне трудно получить нужную информацию из очень простого кода.
Например, у меня нет проблем со сбором данных в этом простом коде:
<HTML>
<TABLE>
<TABLE WIDTH=100%><TR class=FSS-data-row-highlight>...
202 просмотров
schedule
10.05.2022
jsoup — извлечь текст из статьи в Википедии
Я пишу некоторый код Java, чтобы реализовать задачи НЛП над текстами с использованием Википедии. Как я могу использовать JSoup для извлечения всего текста статьи из Википедии (например, всего текста в http://en.wikipedia.org/wiki/Boston )?
6942 просмотров
schedule
12.10.2022
получение значения атрибута из тега Div через jSoup
У меня есть тег Div, как показано ниже
<div id="eventTTL" style="text-transform: uppercase; font-weight: 900;" eventTTL="4583476000">5 days 07:14:41</div>
Как мне узнать значение eventTTL? Я хочу отобразить значение eventTTL,...
17546 просмотров
schedule
08.08.2022
Использование jsoup для обхода запрещенных тегов
Я оцениваю jsoup на предмет функциональности, которая будет очищать (но не удалять!) теги, не внесенные в белый список. Допустим, разрешен только тег <b> , поэтому следующий ввод
foo <b>bar</b> <script...
3699 просмотров
schedule
14.05.2022