в настоящее время отрабатывается способ анализа данных страницы: http://www.foundationfinder.ch/
я люблю делать это на Perl: Ну, я просто размышляю, как лучше всего выполнить эту работу. Угадайте, что я перед хорошей кривой обучения. ;) Это задание даст мне несколько хороших уроков Perl. На данный момент это выходит за рамки моей головы... ;-)
Итак, вот пример страницы:
... и, как я думал, я могу найти все 790 страниц результатов в определенном диапазоне между Id = 0 и Id = 100000, я подумал, что могу пойти по пути с циклом:
http://www.foundationfinder.ch/ShowDetails.php?Id=11233&InterfaceLanguage=&Type=Html http://www.foundationfinder.ch/ShowDetails.php?Id=927&InterfaceLanguage=1&Type=Html http://www.foundationfinder.ch/ShowDetails.php?Id=949&InterfaceLanguage=1&Type=Html http://www.foundationfinder.ch/ShowDetails.php?Id=20011&InterfaceLanguage=1&Type=Html http://www.foundationfinder.ch/ShowDetails.php?Id=10579&InterfaceLanguage=1&Type=Html
я думал, что могу пойти по пути Perl, но я не очень уверен: я пытался использовать LWP::UserAgent для тех же URL-адресов [см. ниже] с разными аргументами запроса, и мне интересно, предоставляет ли LWP::UserAgent как нам перебирать аргументы запроса? Я не уверен, что у LWP::UserAgent есть способ сделать это. Ну, я иногда слышал, что проще использовать Mechanize. Но неужели проще!?
КСТАТИ; Но если я иду по пути PHP, я мог бы сделать это с Curl - не так ли!?
Вот мой подход: я пытался понять это. И я копнул глубже в Manpages и Howtos. У нас может быть цикл создания URL-адресов и многократное использование Curl.
Как отмечалось выше: здесь у нас есть несколько страниц результатов;
http://www.foundationfinder.ch/ShowDetails.php?Id=11233&InterfaceLanguage=&Type=Html http://www.foundationfinder.ch/ShowDetails.php?Id=927&InterfaceLanguage=1&Type=Html
В качестве альтернативы мы можем добавить обработчик request_prepare, который вычисляет и добавляет аргументы запроса перед отправкой запроса.
Опять же: цель: я хочу проанализировать данные, а затем сохранить их в локальной базе данных MySQL.
я должен определить extern_uid !?
и иди так:
for my $i (0..10000) {
$ua->get('http://www.foundationfinder.ch/ShowDetails.php?Id=', id => 21, extern_uid => $i);
# process reply
}
Ну, но теперь я застрял - мне нужна помощь - я могу сделать эту работу так !?
С уважением
нуль