Разница между скребком, краулером и пауком в контексте Scrapy

Пытаюсь прочитать код Scrapy. Слова scaper, crawler и spider сбивают с толку. Например

scrapy.core.scraper
scrapy.crawler
scrapy.spiders

Может ли кто-нибудь объяснить значения и различия этих терминов в контексте Scrapy? Заранее спасибо.


person Frozen Flame    schedule 14.12.2015    source источник


Ответы (1)


Crawler (scrapy.crawler) — это основная точка входа в Scrapy API. Он обеспечивает доступ ко всем основным компонентам Scrapy и используется для подключения расширений к Scrapy.

Компонент Scraper (scrapy.core.scraper) отвечает за разбор ответов и извлечение из них информации. Он запускается из двигателя и используется для запуска ваших пауков.

scrapy.spiders — это модуль, содержащий базовую реализацию Spider (которую вы используете для написания своих поисковых роботов), а также некоторые распространенные поисковые роботы, доступные из коробки (например, CrawlSpider для сканирования на основе набора правил, SitemapSpider для карты сайта). сканирования или XMLFeedSpider для сканирования каналов XML).

Более подробная информация доступна на страницах официальной документации:
http://doc.scrapy.org/en/latest/topics/spiders.html?highlight=crawlspider#spiders http://doc.scrapy.org/en/latest/topics/api.html?highlight=scrapy.crawler#module-scrapy.crawler

person bosnjak    schedule 16.12.2015
comment
«разбор ответов и извлечение информации»: это паук? - person Frozen Flame; 16.12.2015
comment
Да, компонент парсера отвечает за запуск пауков. - person bosnjak; 16.12.2015