Я пытаюсь очистить URL-адреса от https://en.wikipedia.org/wiki/List_of_hedge_funds
В частности, я пытаюсь использовать Apify для очистки этой страницы и возврата списка URL-адресов из тегов привязки, присутствующих в HTML. В моей консоли я ожидаю увидеть значение атрибута href
одного или нескольких тегов привязки, которые существуют на целевой странице, в свойстве с именем myValue
. Я также ожидаю увидеть заголовок страницы в свойстве title
. Вместо этого я просто вижу следующее свойство URL
и его значение.
Актер My Apify использует платформу Puppeteer. Поэтому я использую pageFunction
аналогично тому, как Puppeteer использует это.
Ниже приведен снимок экрана пользовательского интерфейса Apify непосредственно перед его запуском.
Page functionfunction pageFunction( context ) {
// called on every page the crawler visits, use it to extract data from it
var $ = context.jQuery;
var result = {
title: $('.wikitable').text,
myValue: $('a[href]').text,
};
return result;
}
Что я делаю неправильно?