Я использую Scrapy для создания очень простого парсера веб-сайтов.
Если мой подкласс Spider
реализует конструктор, и я запускаю его, scrapy переходит в бесконечный цикл и не запускает паука.
Почему это происходит и как я могу это исправить?
class FinderSpiderTemp(Spider):
name = "temp"
allowed_domains = ["yellowpages.com.au"]
start_urls = []
# if I comment out this function then scrapy console executes happily
def __init__(self, category=None, *args, **kwargs):
super(FinderSpiderTemp, self).__init__(*args, **kwargs)
log.start("log.txt")
self.start_urls = ["http://www.yellowpages.com.au/search/listings?clue=abc&locationClue=8000&selectedViewMode=list&eventType=sort&sortBy=distance"] )
def parse(self, response):
return parse_business_list_page(response)
Я набираю scrapy crawl temp
в консоль scrapy, она ничего не выводит и не отвечает. Вывод ошибки из лога:
2015-05-19 15:28:02+1000 [-] ОШИБКА: 2015-05-19 15:28:02+1000 [-] ОШИБКА:
2015-05-19 15:28:02+1000 [ -] ОШИБКА: 2015-05-19 15:28:02+1000 [-] ОШИБКА:
2015-05-19 15:28:02+1000 [-] ОШИБКА: 2015-05-19 15:28: 02+1000 [-] ОШИБКА:
2015-05-19 15:28:02+1000 [-] ОШИБКА: 2015-05-19 15:28:02+1000 [-] ОШИБКА:
.. ... продолжается вечно