У меня просто несколько вопросов по теме.
Может ли кто-нибудь объяснить преимущества и недостатки использования следующих языков для написания парсера:
Java/Groovy
Перл
PhP
Селен
питон
Мне также интересно, с какими проблемами можно столкнуться при очистке и, возможно, как мне с этим справиться. Например, я столкнулся с идентичностью фрагментов и еще не нашел способа с этим справиться. (я использую htmlunit)
Просто ищу несколько указателей для тех, кто немного разбирается в теме.