Я разбираю большой веб-сайт html, на котором есть более 1000 ссылок href. Я использую Beautifulsoup, чтобы получить все ссылки, но во второй раз, когда я снова запускаю программу, beautifulsoup не может с ней справиться. (найдите все конкретные теги 'td'. Как мне решить эту проблему? Хотя я могу загрузить html-страницу с помощью urllib, все ссылки не могут быть напечатаны. Когда я использую его с тегом find one 'td', он передается.
Tag = self.__Page.find('table', {'class':'RSLTS'}).findAll('td')
print Tag
for a in Tag.find('a', href= True):
print "found", a['href']
Сейчас работаю как
Tag = self .__ Page.find ('table', {'class': 'RSLTS'}). Find ('td')
print Tag
for a in Tag.find('a', href= True):
print "found", a['href']