Должно быть легко ответить на вопрос... Я делаю это неправильно? Могу ли я не создавать несколько столбцов?
>>> val results2 = results.select( results["HCAHPS Base Score"].cast(IntegerType).as(results["HCAHPS Base Score"]), results["HCAHPS Consistency Score"].cast(IntegerType).as(results["HCAHPS Consistency Score"]) )
File "<stdin>", line 1
val results2 = results.select( results["HCAHPS Base Score"].cast(IntegerType).as(results["HCAHPS Base Score"]), results["HCAHPS Consistency Score"].cast(IntegerType).as(results["HCAHPS Consistency Score"]) )
^
SyntaxError: invalid syntax
Синтаксическая ошибка продолжает появляться прямо вокруг запятой...
val
использовать толькоresults2 = results.select( results["HCAHPS Base Score"].cast(IntegerType).as(results["HCAHPS Base Score"]), results["HCAHPS Consistency Score"].cast(IntegerType).as(results["HCAHPS Consistency Score"]) )
- person Rakesh Kumar   schedule 07.03.2017results["HCAHPS Base Score"])
, вместо этого используйтеfrom pyspark.sql.functions import col
, а затем измените свое утверждение наresults2 = results.select( col("HCAHPS Base Score").cast(IntegerType), col("HCAHPS Consistency Score").cast(IntegerType))
- person Rakesh Kumar   schedule 07.03.2017