Проблема возникает, когда я вызываю функцию describe
в DataFrame:
val statsDF = myDataFrame.describe()
Вызов функции описания дает следующий результат:
statsDF: org.apache.spark.sql.DataFrame = [summary: string, count: string]
Я могу нормально показать statsDF
, позвонив statsDF.show()
+-------+------------------+
|summary| count|
+-------+------------------+
| count| 53173|
| mean|104.76128862392568|
| stddev|3577.8184333911513|
| min| 1|
| max| 558407|
+-------+------------------+
Теперь я хотел бы получить стандартное отклонение и среднее значение от statsDF
, но когда я пытаюсь собрать значения, выполнив что-то вроде:
val temp = statsDF.where($"summary" === "stddev").collect()
Я получаю исключение Task not serializable
.
Я также сталкиваюсь с тем же исключением, когда звоню:
statsDF.where($"summary" === "stddev").show()
Похоже, мы не можем фильтровать кадры данных, сгенерированные функцией describe()
?