Насколько затратна операция unpersist на искровых RDD?

Мне интересно, насколько дорогостоящей может быть rdd.unpersist() операция на искровых RDD? И влияет ли настройка Storage Level на производительность этой операции? Любой тест (результаты/техника) будет очень полезен.


person Mayank Raghav    schedule 08.02.2016    source источник
comment
Интересно, почему ты спрашиваешь. Я не могу представить причин для беспокойства по поводу unpersist производительности! :)   -  person Daniel Darabos    schedule 08.02.2016


Ответы (1)


unpersist освобождает RDD из кэша (памяти и диска) и удаляет файлы перемешивания, от которых он зависит. Для этого ему необходимо отправить сообщение исполнителям. Это должна быть самая дешевая операция, которую вы можете выполнить с RDD, вероятно, не заслуживающая внимания.

Также обратите внимание, что при сборке мусора для RDD автоматически вызывается unpersist. Таким образом, вы не можете избежать этих затрат в любом случае.

person Daniel Darabos    schedule 08.02.2016
comment
Спасибо! Это имеет смысл. - person Mayank Raghav; 09.02.2016