Я пробовал приложение WebSphinx.
Я понимаю, что если я поставлю wikipedia.org в качестве начального URL-адреса, он не будет сканироваться дальше.
Следовательно, как на самом деле просканировать всю Википедию? Может ли кто-нибудь дать мне некоторые рекомендации? Нужно ли мне специально идти и находить эти URL-адреса и указывать несколько начальных URL-адресов?
У кого-нибудь есть предложения хорошего веб-сайта с учебником по использованию API WebSphinx?