Парсинг сайта на perl с помощью WWW::Mechanize

Я использовал WWW::Mechanize на Perl для очистки сайта.

Я столкнулся с некоторыми трудностями при входе на конкретный сайт через WWW::Mechanize. Я рассмотрел несколько примеров WWW::Mechanize. Но я не мог узнать свою проблему. У меня есть упоминание ниже моего кода.

#!/usr/bin/perl -w

use strict;
use WWW::Mechanize;
use HTTP::Cookies;
use Crypt::SSLeay;
my $agent = WWW::Mechanize->new(noproxy => 0);
$agent->cookie_jar(HTTP::Cookies->new());
$agent->agent('Mozilla/5.0');
$agent->proxy(['https', 'http', 'ftp'], 'http://proxy.rcapl.com:3128');
$agent->get("http://www.facebook.com");
my $re=$agent->submit_form(
        form_number => 1,
        fields      => {
            Email    => '[email protected]',
            Passwd  =>'xyz'
        }
    );
print $re->content();

Когда я запускаю код, он говорит:

Ошибка при публикации https://www.facebook.com/login.php?login_attempt=1: Не реализовано в ./test.pl, строка 11

Может ли кто-нибудь сказать, что происходит с кодом. Нужно ли мне устанавливать все параметры, которые Facebook отправляет для входа в систему?


person Amila    schedule 10.07.2012    source источник
comment
конечно, я сделал это. Спасибо, что указали мне правильный путь   -  person Amila    schedule 10.07.2012
comment
@daxim: я удалил прокси-метод и запустил его. Затем он приходит: Ошибка POSTing facebook.com /login.php?login_attempt=1: Не удается подключиться к proxy.rcapl.com:3128 (неверный сервис '3128/') в .. Есть ли место, где можно получить настройки прокси. Я работаю над Ubuntu и запускаю терминал. Тем не менее, я в беде. Можете ли вы сказать, где я скучаю?   -  person Amila    schedule 10.07.2012
comment
@daxim: исправлена ​​ошибка. То, что вы сказали, правда. Большое спасибо.   -  person Amila    schedule 10.07.2012


Ответы (1)


Прокси неисправен:

Error GETing http://www.facebook.com: Can't connect to proxy.rcapl.com:3128 (Bad hostname) at so11406791.pl line 11. 

У меня программа работает без вызова метода прокси. Удали это.

person daxim    schedule 10.07.2012
comment
Перемещен предыдущий спекулятивный ответ из раздела комментариев после подтверждения. - person daxim; 10.07.2012