При работе с наборами данных в Spark нам нужно указать кодировщики для сериализации и десериализации объектов. У нас есть возможность использовать Encoders.bean(Class<T>)
или Encoders.kryo(Class<T>)
.
Чем они отличаются и каковы последствия для производительности при использовании одного по сравнению с другим?