Databricks: разница между монтированием и прямым доступом Data Lake Storage Gen 2

В чем разница между подключением Azure Data Lake Store Gen2 к Databricks с использованием предварительной службы и прямого доступа с использованием ключа SAS?

Я хочу знать разницу в сроках передачи данных, безопасности доступа

Спасибо


person I.Chorfi    schedule 15.05.2019    source источник


Ответы (1)


Если вы смонтируете хранилище, все пользователи на всех кластерах получат доступ.

Если вы не монтируете и не подключаетесь непосредственно в сеансе с использованием субъекта-службы или SAS (я не думаю, что ключ SAS официально поддерживается, BTW), пользователь в этом сеансе должен иметь доступ к учетным данным для создания подключения.

Руководители служб также могут иметь низкоуровневые разрешения, применяемые в озере, такие как ограничение доступа к определенным папкам.

Обратите внимание, что с ADLS Gen2 теперь у вас также есть возможность передавать учетные данные пользователя: https://docs.azuredatabricks.net/spark/latest/data-sources/azure/adls-passthrough.html

Никаких отличий в производительности не знаю.

person simon_dmorias    schedule 09.06.2019