когда df1 и df2 имеют одинаковые строки и
df1 и df2 не имеют повторяющегося значения
какова сложность операции соединения df1.join (df2)?
мой вопрос - взять O (n ^ 2)
и можно ли отсортировать фрейм данных и повысить его производительность? если это не так, как можно быстрее присоединиться к im pyspark?