Перехват Mechanize 404 => Net::HTTPNotFound

Я написал простую функцию, которая обрабатывает получение URL-адреса:

def tender_page_get url, agent
  sleep(rand(6)+2)
  begin
    return agent.get(url).parser
  rescue Errno::ETIMEDOUT, Timeout::Error, Net::HTTPNotFound
    EYE.debug "--winter sleep #{url}"
    puts "-x-#{url}"
    sleep(300)
    tender_page_get url, agent
  rescue => e
    puts "-x-#{url}"
    EYE.debug "--unknown exception"
    EYE.debug "#{url} #{e.inspect}"
  end
end

Проблема в том, что хотя я ловлю Net::HTTPNotFound в своем первом блоке восстановления, я все еще вижу в своем журнале такие записи, как:

--unknown exception
{url} 404 => Net::HTTPNotFound

что означает, что это исключение было перехвачено вторым блоком восстановления. Что может быть причиной этого?


person spacemonkey    schedule 08.05.2011    source источник


Ответы (1)


Mechanize вызывает Mechanize::ResponseCodeError для ошибки 404, а не Net::HTTPNotFound. To_s в Mechanize::ResponseCodeError выглядит следующим образом:

def to_s
  "#{response_code} => #{Net::HTTPResponse::CODE_TO_OBJ[response_code]}"
end

Это возвращает '404 => Net::HTTPNotFound', что создает впечатление, что это возбуждаемое исключение.

person David Tinker    schedule 22.05.2011
comment
в этом сценарии у нас есть определенная строка, которую мы можем перехватить для HTTP 404? Извините, я новичок в рубине, и из вашего ответа, объясняющего причину проблемы, я не смог найти решение. - person Arnab; 05.06.2020