У меня есть фрейм данных, называемый статьей
+--------------------+
| processed_title|
+--------------------+
|[new, relictual, ...|
|[once, upon,a,time..|
+--------------------+
Я хочу сгладить его, чтобы получить его как мешок слов. Как я мог добиться этого, используя текущую ситуацию. Я пробовал приведенный ниже код, который, кажется, дает мне проблему несоответствия типа.
val bow_corpus = article.select("processed_title").rdd.flatMap(y => y)
В конечном итоге я хочу использовать этот bow_corpus для обучения модели word2vec.
Спасибо