Я пытаюсь получить все URL-адреса с id='revSAR'
из тега HTML ниже, используя регулярное выражение Python:
<a id='revSAR' href='http://www.amazon.com/Altec-Lansing-inMotion-Mobile-Speaker/product-reviews/B000EDKP8U/ref=cm_cr_dp_see_all_summary?ie=UTF8&showViewpoints=1&sortBy=byRankDescending' class='txtsmall noTextDecoration'>
See all 136 customer reviews
</a>
Я попробовал код ниже, но он не работает (ничего не печатает):
regex = b'<a id="revSAR" href="(.+?)" class="txtsmall noTextDecoration">(.+?)</a>'
pattern=re.compile(regex)
rev_url=re.findall(pattern,txt)
print ('reviews url: ' + str(rev_url))
a
ссылок с помощью Beautiful Soup: groups.google.com/forum /?fromgroups#!topic/beautifulsoup/ - person Paul   schedule 20.08.2013