Вопросы по теме 'mechanize'

Сайты парсинга, требующие поддержки javascript
Возможный дубликат: Скребок экрана с веб-страницы с большим количеством Javascript Я просто хочу выполнять такие задачи, как ввод формы и веб-скрапинг, но на сайтах, требующих поддержки javascript. И мне также нужно вводить формы,...
2706 просмотров

Как я могу использовать Perl для очистки веб-сайта, который раскрывает свое содержимое с помощью JavaScript?
Мне нужно написать Perl-скрипт для очистки веб-сайта. Веб-сайт можно очистить только с помощью JavaScript, а пользователь работает в Windows. Я каким-то образом использовал Win32::IE::Mechanize на своей рабочей машине, что имеет IE6, но потом я...
1157 просмотров

Проблемы с Perl Mechanize и прокси
Я разочаровывал себя в этом слишком много часов. Я думаю, что это должно быть просто, но у меня явно есть что-то принципиально неправильное. Я прочел: Я прочитал документы cpan для: WWW-Mechanize/lib/WWW/Mechanize/FAQ.pod...
1708 просмотров
schedule 05.03.2023

Используйте механизировать, чтобы войти в megaupload
Я пытаюсь использовать следующий код для входа в megaupload. Мой вопрос в том, как я могу успешно войти в систему? Я распечатываю текущий URL-адрес в конце кода, но когда я запускаю скрипт, он просто возвращает www.megaupload.com. import...
1968 просмотров
schedule 23.10.2022

Прокси, кажется, игнорируется Mechanize?
Я использую http-прокси и модуль Mechanize. Я инициализирую объект механизации и устанавливаю прокси-сервер следующим образом: self.br = mechanize.Browser() self.br.set_proxies({"http": proxyAddress}) #proxy address is like 1.1.1.1:8080...
2253 просмотров

Ruby Mechanize помогает очистить экран
Я пытаюсь очистить строку в таблице с датой. Я хочу очистить только третью строку с сегодняшней датой. Это мой механический код. Я пытаюсь выбрать строку столбца, в которой есть сегодняшняя дата, а также ее и ее столбцы:...
1273 просмотров
schedule 17.08.2023

Тайм-аут Perl Mechanize не работает с https
Я использовал библиотеку Perl Mechanize, но по какой-то причине с параметром тайм-аута https (я использую Crypt::SSLeay для SSL). мой $browser = WWW::Mechanize->new(autocheck=>0, timeout=>3); Кто-нибудь сталкивался с этим раньше и знает,...
1800 просмотров
schedule 31.03.2023

Базовая и формальная аутентификация с помощью Mechanize (Ruby)
Я пытаюсь войти на сайт во внутренней сети компании, на котором есть всплывающее диалоговое окно базовой проверки подлинности и проверка подлинности на основе формы. Это код, который я использую (что приводит к ошибке 401 => Net::HTTPUnauthorized):...
10135 просмотров

Ruby Mechanize извлекает заголовки
Я использую механизм для веб-проверки, когда я получаю URL-адрес, я получаю URL-адрес обновления в заголовках: meta http-equiv="refresh" content="2;url=/html/Splash.action?splash=" Когда я прошу механизировать список метаданных, я делаю это:...
723 просмотров
schedule 14.07.2022

Perl::Mechanize: запуск простого поискового робота с циклом [несколько запросов]
в настоящее время отрабатывается способ анализа данных страницы: http://www.foundationfinder.ch/ я люблю делать это на Perl: Ну, я просто размышляю, как лучше всего выполнить эту работу. Угадайте, что я перед хорошей кривой обучения. ;) Это...
309 просмотров
schedule 14.06.2023

Файлы cookie в Mechanize 2.0
Я только что обновился и у меня возникла проблема. Раньше этот код работал нормально: page = ag.get(login_url) form = page.forms.first form.field_with(‘user[login]‘).value = login form.field_with(‘user[password]‘).value = password page =...
401 просмотров
schedule 09.06.2022

Не удается найти формы на веб-странице с помощью модуля Perl - WWW:Mechanize
Я использую модуль perl WWW:Mechanize До сих пор все было хорошо, но для определенной веб-страницы не удалось найти существующую форму: <form id="formaction" method="post" action="omadm_locate.php"> Хотя, когда я печатаю содержимое...
680 просмотров
schedule 21.02.2024

Требуется решение для установки Mechanize без яйца - сбой Py2exe
Я ломал голову, как заставить Mechanize установить без яйца в Win7. Я попробовал метод easy_install --allways-unzip. Метод easy_install -Z. Добавлен файл .pth в каталог site-packages. Добавлены комбинации вышеперечисленного. Py2exe плохо...
959 просмотров
schedule 13.10.2022

Кнопки отправки Ruby Mechanize работают неправильно
Я работаю над скриптом Ruby, который вводит данные в поле поиска, а затем должен нажать кнопку ввода. Глядя на «pp», мои данные правильно вводятся в поле поиска. Проблема, с которой я сталкиваюсь, это нажатие на кнопку «Ввод». Происходит то, что он...
1061 просмотров
schedule 01.06.2022

создание эскизов с помощью WWW::Mechanize::FireFox с использованием Mozrepl — некоторые попытки отладки
хорошо, я запускаю этот скрипт, который написан для того, чтобы сделать несколько скриншотов веб-сайтов, которые у меня также есть, и работает mozrepl здесь у нас есть файл с некоторыми запрошенными URL-адресами ... обратите внимание, что это всего...
298 просмотров

Очистка экрана, когда результаты не могут быть найдены?
У меня есть следующий код в задаче очистки экрана грабли page = agent.get("https://domainname.co.uk/unit/27/logs?type=incoming&page=8") page = agent.page.search("table tbody tr").each do |row| next if (!row.at('td')) time, source,...
363 просмотров
schedule 13.02.2023

Парсинг сайта на perl с помощью WWW::Mechanize
Я использовал WWW::Mechanize на Perl для очистки сайта. Я столкнулся с некоторыми трудностями при входе на конкретный сайт через WWW::Mechanize. Я рассмотрел несколько примеров WWW::Mechanize. Но я не мог узнать свою проблему. У меня есть...
1242 просмотров
schedule 12.10.2022

Преобразователь кода Ruby Mechanize не найден
Например, я пробовал массу вещей: Механизировать проблему с кодировкой Ruby 1.9.3 и Как преобразовать объект Mechanize::File в объект Mechanize::Page? Но ошибка, которую я продолжаю получать,...
1163 просмотров

выберите элементы и щелкните ссылку, если условие
Как написать код, который будет переходить по ссылкам на веб-странице с заданными условиями: Сценарий должен просмотреть каждую строку div.table и проверить, содержит ли элемент списка (div.domains ul li) в div определенную строку (somedomain.com),...
373 просмотров

Разбор искаженного HTML с помощью Mechanize (Ruby)
Я хотел бы обработать ответ HTTP, который содержит много HTML, но сам не является допустимым файлом HTML. Я знаю, что могу использовать Nokogiri следующим образом: page = Nokogiri::HTML.parse(page.body) однако я хотел бы иметь доступ к Mechanize...
250 просмотров
schedule 16.02.2022