rdd.map дает: TypeError: неподдерживаемый тип (ы) операнда для -: 'Row' и 'float'
Я создаю rdd из фрейма данных, используя:
temprdd = df.select('results').rdd
Затем я хочу выполнить расчет для всех объектов в нем (в основном в моем столбце «результаты», который я теперь считаю своим собственным rdd):
sqrt(temprdd.map(lambda x : pow(x-mean,2)).sum())
Но я получаю:
Файл "/usr/local/src/spark20master/spark/python/pyspark/rdd.py", строка 999, в ответ self.mapPartitions(lambda x: [sum(x)]).fold(0, operator.add) Файл "", строка 7, в TypeError: неподдерживаемые типы операндов для -: "Row" и "float"
Я имею в виду поплавок. Значение, которое я ожидаю от x, будет числом с плавающей запятой; но читается как ряд, я думаю. Что о, что я делаю неправильно? Спасибо.