Databricks, AzureCredentialNotFoundException

У меня есть кластер High Concurency с включенной интеграцией Active Directory. Время выполнения: Последняя стабильная версия (Scala 2.11), Python: 3.

Я подключил Azure Datalake, и когда я хочу прочитать данные, всегда в первый раз после запуска кластера я получаю:

com.databricks.backend.daemon.data.client.adl.AzureCredentialNotFoundException: Could not find ADLS Gen1 Token

При повторном запуске все работает нормально. Я читаю данные следующим образом:

df = spark.read.option("inferSchema","true").option("header","true").json(path)

Есть идеи, что не так?

Спасибо! Томек


person user3220504    schedule 05.07.2019    source источник
comment
Вы можете сослаться на эту статью, в которой объясняется та же проблема: kb .azuredatabricks.net / data-sources /   -  person CHEEKATLAPRADEEP-MSFT    schedule 06.08.2019


Ответы (1)


Я считаю, что вы можете запустить команду только в кластере с высоким уровнем параллелизма. Если вы подключили свой ноутбук к стандартному кластеру, команда не сработает.

person Jonathan    schedule 09.04.2020
comment
Вопрос начинается с того, что у меня кластер с высоким параллелизмом .... - person Xypron; 09.04.2020
comment
Да, но он, возможно, не подключил ноутбук к кластеру с высоким уровнем параллелизма. - person Jonathan; 19.04.2020