Как родословная помогает пересчитывать данные?
Например, у меня есть несколько узлов, каждый из которых обрабатывает данные по 30 минут. Если один из них выйдет из строя через 15 минут, можем ли мы снова пересчитать данные, обработанные за 15 минут, используя родословную, не давая снова 15 минут?
toDebugString
на RDD. Вы сможете увидеть происхождение этого конкретного rdd. - person philantrovert   schedule 18.08.2017